« 読了:「はたらくすすむ」「LOST DRIVE」「天国ニョーボ」「むしろウツなので結婚かと」 | メイン | 読了:今井(2016) マーケティングミックスモデル・レビュー »
2019年7月 9日 (火)
ビッグデータ統計解析入門 経済学部/経営学部で学ばない統計学
[a]
照井 伸彦 / 日本評論社 / 2018-12-12
著者はマーケティング・サイエンスの有名な先生。副題に「経済学部/経営学部で学ばない統計学」とある。「経済セミナー」誌での連載の書籍化である由。
ちゃんと読んだわけじゃないけど(すいません)、今後必要な時に参照できるように、何が書いてあったかだけメモしておく。
- 1章: イントロ。ビッグデータとはなにか、頻度主義統計学の限界、etc.
- 2章: ベイズ統計の基本。事後分布の評価としてまず共役事後分布について説明し、モンテカルロ積分、解析的近似(変分ベイズ)についてちらっと紹介。
- 3章: 前半はナイーブベイズによる分類。後半はベイジアン・ネットワークのかんたんな紹介。
- 4章: 階層的クラスタリング、k-means法、アソシエーションルール、CART、バギング、ランダムフォレスト、ブースティングについて、それぞれ簡単に紹介。
- 5章: まず線形判別の紹介。実例とともに、感度、ROC曲線、class imbalanceを紹介。ロジスティック回帰の紹介。最後に、SVMの紹介が4p(これは...はじめて読んだ人は狐につままれたような気分になるだろうな...)、計算例。
- 6章: PCAとEFAの紹介(回転についての説明はしてないみたいだ)、主成分回帰とPLS回帰の紹介(へええ... PLS回帰の説明はこの厚さの本にしてはちょっとレアかも)、リッジ回帰とLASSO。最後の実例のところでクロスバリデーションが出てくる。
- 7章: テキスト解析の章。まずワードクラウドを紹介。で、LDAについての説明が実習込みで9p、ここは力が入っている感じ。
- 8章: NNの章。シグモイド関数とsoftmaxを紹介し、多値選択問題を3層NNでモデル化する実習。で、ディープラーニングについてほんのちらっと紹介(1pとちょっと)。
財務諸表から倒産確率を線形判別するモデルをアルトマンモデルというのだそうだ。知らなかった。
データ解析 - 読了:「ビッグデータ統計解析入門」