書誌種別 |
図書 |
タイトル |
Python,Rで学ぶデータサイエンス |
シリーズ名 |
DIGITAL FOREST |
タイトルヨミ |
パイソン アール デ マナブ データ サイエンス |
シリーズ名ヨミ |
ディジタル フォレスト |
人名 |
Chantal D.Larose/著
Daniel T.Larose/著
阿部 真人/訳
西村 晃治/訳
|
人名ヨミ |
Chantal D Larose Daniel T Larose アベ マサト ニシムラ コウジ |
人名ヨミ |
|
出版者・発行者 |
東京化学同人
|
出版者・発行者等ヨミ |
トウキョウ カガク ドウジン |
出版地・発行地 |
東京 |
出版・発行年月 |
2020.11 |
ページ数または枚数・巻数 |
17,242p |
大きさ |
21cm |
価格 |
¥2400 |
ISBN |
978-4-8079-0995-7 |
ISBN |
4-8079-0995-7 |
注記 |
原タイトル:Data science using Python and R |
分類記号 |
007.609
|
件名 |
データマイニング
/
プログラミング(コンピュータ)
|
内容紹介 |
データに触れ、可視化し、予測モデルを構築し、性能を評価するというデータサイエンスに必要な一通りの流れを学べるテキスト。データ分析の実践的な問題を多数収載し、PythonとRの両方で分析コードを紹介する。 |
言語区分 |
JPN |
タイトルコード |
1009812445870 |
目次 |
1.イントロダクション |
|
1・1 なぜデータサイエンスが必要なのか/1・2 データサイエンスとは何か/1・3 データサイエンスの方法論/1・4 データサイエンスのタスク/練習問題 |
|
2.PythonとRの基礎 |
|
2・1 Pythonのダウンロード/2・2 Pythonプログラミングの基礎/2・3 RとRStudioのダウンロード/2・4 Rプログラミングの基礎/参考資料/練習問題 |
|
3.データ準備 |
|
3・1 銀行マーケティングデータセット/3・2 分析課題を設定する/3・3 データの準備/3・4 インデックスの付与/3・5 モデルに悪影響をもたらす変数値の変換/3・6 カテゴリ変数から数値変数への変換/3・7 数値変数の正規化/3・8 外れ値の特定/参考資料/練習問題 |
|
4.探索的データ解析 |
|
4・1 探索的データ解析(EDA)と仮説検定/4・2 複合棒グラフと目的変数/4・3 分割表/4・4 複合ヒストグラム/4・5 説明変数のビン化/参考資料/練習問題 |
|
5.モデル構築下準備 |
|
5・1 第4章までのおさらい/5・2 データ分割/5・3 データ分割の評価/5・4 学習用データセットの均衡化/5・5 モデル性能のベースラインの策定/参考資料/練習問題 |
|
6.決定木 |
|
6・1 イントロダクション/6・2 CARTアルゴリズム/6・3 C5.0アルゴリズム/6・4 ランダムフォレスト/参考資料/練習問題 |
|
7.モデルの評価 |
|
7・1 イントロダクション/7・2 分類モデルの評価指標/7・3 感度と特異度/7・4 適合率,再現率,Fβ値/7・5 モデル評価手法/7・6 モデル評価の適用例/7・7 不均等な損失の考慮/7・8 不均等な損失の有無によるモデル比較/7・9 データドリブンな損失の定義/練習問題 |
|
8.単純ベイズ分類器 |
|
8・1 単純ベイズの紹介/8・2 ベイズの定理/8・3 最大事後確率/8・4 条件付き独立/8・5 単純ベイズ分類器の適用例/参考資料/練習問題 |
|
9.ニューラルネットワーク |
|
9・1 ニューラルネットワーク入門/9・2 ニューラルネットワークの構造/9・3 結合の重みと組合わせのための関数/9・4 シグモイド型の活性化関数/9・5 誤差逆伝播法/9・6 ニューラルネットワークの適用例/9・7 ニューラルネットワークにおける重みの解釈/9・8 Rでのニューラルネットワークの使い方/練習問題 |
|
10.クラスタリング |
|
10・1 クラスタリングとは何か?/10・2 k‐meansクラスタリングアルゴリズム入門/10・3 k‐meansクラスタリングの適用/10・4 クラスターの検証/10・5 Pythonによるk‐meansクラスタリングの実行方法/10・6 Rによるk‐meansクラスタリングの実行方法/練習問題 |
|
11.回帰モデル |
|
11・1 推定タスク/11・2 記述的回帰モデル/11・3 多変量回帰モデルの応用例/11・4 Pythonを用いた重回帰/11・5 Rを用いた重回帰/11・6 推定に対するモデルの評価/11・7 ステップワイズ回帰/11・8 回帰のベースとなるモデル/参考資料/練習問題 |
|
12.次元削減 |
|
12・1 次元削減の必要性/12・2 多重共線性/12・3 分散拡大係数を用いた多重共線性の確認/12・4 主成分分析/12・5 主成分分析の応用/12・6 何個の成分まで取り出すか/12・7 k=4でPCAを実行する/12・8 主成分の検証/12・9 Pythonを用いた主成分分析の実行法/12・10 Rを用いた主成分分析の実行法/12・11 多重共線性が問題にならないとき/参考資料/練習問題 |
|
13.一般化線形モデル |
|
13・1 一般化線形モデルの概要/13・2 一般化線形モデルとしての線形回帰/13・3 一般化線形モデルとしてのロジスティック回帰/13・4 ロジスティック回帰の例/13・5 ポアソン回帰/13・6 ポアソン回帰の例/参考資料/練習問題 |
|
14.アソシエーションルール |
|
14・1 イントロダクション/14・2 アソシエーションルールの簡単な抽出例/14・3 支持度,信頼度,リフト値/14・4 アソシエーションルールの抽出/14・5 指標の確認/14・6 信頼度差分基準/14・7 信頼度比率基準/参考資料/練習問題 |
|
付録:データの要約と可視化 |
|
A・1 要約1:データ分析のブロックの構築/A・2 可視化:データを要約および整理するためのグラフと表/A・3 要約2:中心,ばらつき,位置の尺度/A・4 2変量の関係の要約と可視化 |