読書日記: 読了：Allenby & Rossi (2008) 学生にベイズ統計をこうやって教えてます (feat. 「孫文の義士団」)

« 読了：Srinivasan & Mason (1986) Bassモデルは非線形最小二乗法で推定しろ | メイン | 読了：Koenker (2015) 分位点回帰パッケージ quantreg »

2016年4月22日 (金)

Allenby, G.M., Rossi, P.E. (2008) Teaching Bayesian Statistics to Marketing and Business Students. The American Statistician, 62(3), 195-198.
　ベイジアン・モデリングの大スター Allenby兄貴がお送りする、「俺はビジネススクールの統計学のクラスでベイズ統計を教えてるぜ」エッセイ。

　(私が彼を兄貴と呼ぶ理由は、何度でも書きますが、主著"Bayesian Statistics and Marketing"においてAllenbyが読者に求める無理難題が、香港のカンフースター、ドニー・イェン兄貴が共演者に求めるという無理難題と似ているからである)

　以下、すごくいいかげんなメモ：

　なんといっても大変なのは、尤度ベースの推論の価値と、情報事前分布の意義について教えることですね。経済統計あがりの学生は事前分布に懐疑的だし、積率法と漸近分布の理論に慣れてるし。修士で統計やってましたっていう学生でも、ベイズ統計は練習問題くらいしかやってないし。
　とにかく基礎教材が大事だと思います。情報事前分布が、主観的な事前情報の組み込みという点だけではなく、スムーズネスや数値的安定性という点でも大事だと教え込むわけです。パネルデータ分析で、階層ベイズ離散選択モデルじゃないとできない分析を教えるとか。
　
　講義の具体的な内容ですか？
　教えているのはオハイオ州立大とシカゴ大のPh.Dコースの学生です。教科書はもちろん"Bayesian Statistics and Marketing"。この本にはRのbayesmパッケージがついてますからね、そりゃもう、うまくいってますよ。
　毎週の宿題では、いろんな問題について実装の練習をさせてます。基本的なコードを渡して拡張させるんです。回帰分析のコードを渡して、係数に順序制約をつけなさい、とか。スクラッチから書かせると、標準的な公式について直接にアホな実装してきますからね。クロネッカー積の関数を使うとか、逆行列とか行列式を求めるとか、そういうのはやらせたくないわけです。コレスキー分解とクロス積の関数で済ませたほうがいい。
　えーと、コースの前半はベイズ統計の基礎に割きます。標準的な内容だと思うけど、手法や実装の実用的な価値、それから情報分布に力を入れてます。後半はマーケ・ビジネス寄りです。潜在変数モデル、多項離散モデル、多変量離散モデル、離散選択モデルの需要理論[←?]、ユニット・レベルの尤度を使った離散変数の階層モデル、モデル選択と決定理論、同時性、ってとこですね。
　最後に、最近の研究から事例を選ばせて、ベイズ統計の観点からどうやって解けるか、というのをやります。ケーススタディを５つ、本に載せたから、読んでみてください。
　成績は宿題と最終レポートでつけます。宿題の採点はなるべく優しく... 単位がもらえるかどうかみんなおびえてますからね。レポートのほうは、学術論文と似た形で書かせます。テーマは自由だけど、標準的な回帰モデルはダメ。自分がやってる研究と関連する内容について取り組むのが理想ですね。実データの分析だけじゃなくてシミュレーションもさせます。目標は、自分のデータの尤度関数について真剣に考えさせることです。
　
　ミクロレベルのデータを扱っている学生にとって、消費者異質性のベイズ的な取り扱いはとても重要です。異質性の一般的なモデルを一連の条件つき分布で構築できます。
　$y_i | \theta_i \ \ \sim \pi_1 (\theta_i)$
　$\theta_i | \tau \ \ \sim \pi_2 (\tau)$
　$\tau | h \ \ \sim \pi_3(h)$
最初の条件つき分布を僕らはユニットレベル尤度と呼んでます。マーケティングだと$y_i$はたいていなんらかの形で離散的です。2つめの条件付き分布は、パラメータについての事前情報の一部になってます。経済統計ではランダム係数の分布って呼びますが、僕らはこれも尤度の一部だと捉えます。たいていの場合、一番関心が持たれるのは3番目の$\tau$です。学生に教えるポイントは、階層モデルと事前分布の価値、そして、すべての未知の量をランダムだと捉える推論手法の価値です。
　非正則事前分布を使う場合、階層モデルでは事後分布が必ずしも存在しません。階層モデルというアイデアは正則事前分布においてのみ意味を持ちます。だから学生は事前分布の重要性について真剣に考えないといけないわけです。
　階層モデルはモジュラー的で、モデリングの面でもアルゴリズムの面でも実装が楽だ、という点も、ベイズ統計に懐疑的な学生にとっていい勉強になります。ある事前分布について標準正規分布を混合分布に切り替える、ディリクレ分布に切り替える、なんてことが容易にできます。
　同時性についての議論も学生の関心を惹くようです。ビジネスデータはたいてい、消費者の企業の相互作用の結果で、どちらも同時に自分の行動を最適化しようとしてますから。需要-供給の同時モデルは尤度の最大化が難しくなるので、シミュレーション手法がぴったりです。よくベイズ統計の教科書には回帰モデルが載ってますが、そういうのではベイズ統計の力がわかりにくいんんじゃないですかね。

　[ここでbayesmパッケージの紹介。分布の可視化も大事なのよ、bayesmパッケージにはそういう機能もあるよ、とのこと。パス]

　というわけで、優秀な学生ならば、およそどんなモデルであっても推定できる概念的・操作的なスキルが身に付きます。そうでもない学生であっても、自分がやってる分析の背後にある想定について評価する能力は身に付きます。
　悩みとしては... 学生からの評判はいいんですけど、宿題が多すぎるっていう不満の声もありますね。それから事後分布について、可視化して全体を検討させたいんですが、どうしても積率での要約に頼ってしまい、なかなかうまくいかないです。決定理論に対するベイズ統計の価値についても、説明の時間がなかなか取れないです。
　コース終了後、勤勉な学生がさらに勉強を進める際にもbayesmパッケージは役立ちます。修了生のなかにはベイズ統計を使った応用論文を書いた人もいますよ。

　。。。Allenby兄貴。。。学生に対しても、ドニー兄貴なみの厳しさであったか。。。

　せっかくなので(なにがだ)、ここでドニー兄貴のアクション・シーン。「孫文の義士団」(2009, 陳徳森監督)より。いったん撮り終えたアクションが気に入らず監督に直訴、自分のチームのメンバーを急遽招集、自らアクション監督をつとめて自腹で撮り直した、といういわくつきの名場面である。

　雑踏を駆け抜けるドニー兄貴も素晴らしいが、敵役のカン・リーが登場する直前、モノやらヒトやらがなぜか上方向に吹っ飛んでいくというカットもとても面白いと思うのです。カン・リーの並外れた怒りと力を表現しているんだけど、アニメーションのようなコミカルさがある。

論文：データ解析(2015-) - 読了：Allenby & Rossi (2008) 学生にベイズ統計をこうやって教えてます (feat. 「孫文の義士団」)

読書日記

読んだ本を淡々と記録します

2016年4月22日 (金)