« 読了:Bethos, et al. (2009) アイデア市場プラットホームIDEM | メイン | 読了:「よつばと!」「たそがれメモランダム」「イムリ」「アイアムアヒーロー」「亜人ちゃんは語りたい」「闇金ウシジマくん」「さらばゲイツちゃん」 »
2015年12月 3日 (木)
Zyphur, M.J., Oswald, F.L. (2015) Bayesian Estimation and Inference: A User's Guide. Journal of Management, 41(2), 390-420.
この雑誌のこの号は「経営科学におけるベイジアン確率・統計学」という特集号で、この論文は編者による啓蒙的内容。ちょっと事情があって目を通したんだけど、これ、31頁もあるやんか...
この号の所収論文の題名をメモしておくと:
- 経営におけるベイズ的思考の抵抗しがたい興隆:決定分析からの歴史的教訓
- 組織科学におけるベイズ主義の制度化:実用的ガイド、有名学者のコメントつき [←ほんとにこういう題名]
- ベイジアン構造方程式モデリングの武勇と落とし穴:経営科学のための重要な考慮事項 [←あ、たまたま読んでた。私は反論のほうが分があると思ったけど、それは私がMuthen信者だからかもしれない]
- 経営研究のためのベイジアン仮説検定入門
- 業務の相対的効果:順序仮説のベイズ・ファクター [←相対的重要性の話らしい。おおっと、これは読まなきゃ]
- ベイジアンモデル選択によって対人プロセスとチーム業績の経時的変化を社会的影響力の観点から解釈する
- アントレプレナーシップの決定要因再訪:ベイジアン・アプローチ
- 実践の組織的コミュニティのオペレーショナルなインパクト:組織変化分析に対するベイジアン・アプローチ
- 組織における知識共有:近接性とフォーマル構造の役割についてのベイジアン分析
- 経営科学における一般化可能性理論のアップデート:分散成分のベイジアン推定 [←ぐわー。蕁麻疹でそう]
- 効果量のメタ分析的評価を情報ベイズ事前分布で改善する [←効果量推定とかは別にどうでもいいんだけど、企業の過去経験をinformative priorで表現するっていう実例なら読んでみたいなあ。要旨ではいまいち判断がつかない]
ほかに、Gigerenzerさん, Gelman大先生、Galavottiという人のEditorial Commentaryがついている。
著者曰く、
社会科学におけるベイジアン革命の意義は:(1)検証可能な仮説の範囲を広げ、帰無仮説有意性検定(NHST)に依存しない直観的な解釈を可能にする。(2)事前の知見と新データを結合できる。その結果は自動的にメタ分析となる。(3)事前の知見を使うことで、より小標本の研究を可能にする。(4)伝統的な推定方法なら複雑すぎて失敗するようなモデルでも推定できるようになる。
伝統的アプローチは頻度主義の確率理論に依存している。そのせいで、ORにおいてはp値と信頼区間の混同が起きたり、小標本研究が抑制されたり、多くの統計モデルが推定不能になっていたりする。ベイジアン・アプローチをお勧めしたい。
ふたつのアプローチを比較しよう...
...というわけで本編が始まるのだが、初心者向けの概観なので、以下メモは簡単に。
前半の話の流れはこんな感じ。
まず、ベイジアンはパラメータをデータの下での確率変数として捉えるのよという話。次にベイズのルールの話をして、事前分布$P(\theta)$, 尤度$P(z|\theta)$、事後分布$P(\theta|z)$を導入。
事前分布を決めるのが難しい。次の3つがある。
- 情報事前分布。利点:過去の研究の知見を利用できる;小標本研究を促進;手元のデータから得られる尤度を事前分布で補うことができる。
- 経験事前分布。利点:たとえばマルチレベルモデリングで、全データでグループ平均を推定し、かつ一部のデータでパラメータを推定することができる。いっぽう、シングルレベルモデルではデータで尤度と事前分布の両方を推定していることになり、これはおかしい。
- 無情報事前分布。標準的なルールでつくった無情報事前分布のことを「客観事前分布」と呼ぶこともある。
事前分布をどう更新するかというのを、コイン投げを例に紹介。[ここ、眠くて読んでない]
いきなり、MCMCってのがあるんだよ、と紹介。詳しくは参考書を読め。[共役事前分布の話とかしないんだ... 時代だなあ]
ベイジアン推論の例として2つ紹介。
- パラメータの事後分布から信用区間を求める。頻度主義的な信頼区間との違いを説明。
- モデル比較。posterior predictive checkingについて紹介。[この説明だけ読んでもよくわかんないけど、PPPってやつですね。モデル比較と云えばベイズ・ファクターの話になるかとおもったら、そっちは省略している。DICにもほとんど触れていない。へー、そういうものか]
最後に、頻度主義との違いを整理。
- 頻度主義では確率は観察に適用されるのであってパラメータに適用されるのではない。
- 事前分布がない。
- サンプルサイズが小さいと、効果が大きくても帰無仮説を棄却できない。
後半は、自分の昔の研究を取り上げてベイジアンでやりなおすというデモンストレーション。
例1はSEM。5指標1因子(社会的身分)、その因子に外生変数(テスタトロン)からのパスが刺さるというモデル。Mplusで残差共分散を片っ端からベイズ推定したら(事前分布の分散は思い切り小さくするわけね)、テスタトロンの効果が小さくなった、とかなんとか。ちゃんと読んでないけど。[編者がこんなにMplus推しの解説をしているのと同じ号に、Stromeyer et al. のMuthen批判が載ったのか... すごいな]
例2はANOVA。これは面白いのでちゃんとメモを取ろう。
元論文は、先行する自己制御が将来のパフォーマンスに与える影響を調べたもの。自我消耗理論によれば、自己制御能力とは限定的な資源であり、使いすぎると枯渇してしまう。そこで実験。学生に{楽しい, 悲しい}ビデオを見せて、{感情的反応を抑圧するように教示(自己制御群), 非教示(統制群)}。で、陸軍の戦闘シミュレーションをさせて、判断の正しさ、課題遂行の所要時間、調べた属性の平均個数[←なんだかわからん]を測定。つまり、従属変数は3つ、2x2の被験者間2要因実験だ。対象者は全部で80人。
元論文では各従属変数についてOLS回帰をかけた。いずれの変数でも、ビデオ種別と交互作用は有意でなかった。判断の正しさにおいてのみ、自己制御群が有意に低かった。これが一番大事な結果変数だったので、自我消耗理論の予測が支持されましたね、という結果ではあった。
さて、欠点が二つある。まず、理論も先行研究もあるのに分析で使ってない。自己制御群は課題遂行時間が短くなり属性数が減るという仮説があるのに。また、小標本だったので、model-wideな最尤推定値ではなくてOLS推定値を使っている。ほんとうは3本まとめたパス解析をやったほうがいいのに。
というわけで、Mplusでやりなおしましょう。自我消耗のメタ分析研究に基づき、パラメータと残差分散の情報事前分布を決める[うっわー。求め方が細かく書いてあるけどパス]。パス解析すると、果たして、どの変数においても要因の効果の信用区間は0を含みませんでした。つまり理論的予測がさらに強力に支持されました、云々。
[うぐぐぐぐ。素朴な疑問なんだけど、こういう分析の意義はなんだろう? 先行研究のメタ分析から事前分布をつくって実験データで更新するという分析も確かに面白いけど、もし先行研究に知られざる系統的誤謬があったら、それを末永く引きずることになるわけで...早い話ですね、戦前のアメリカには「黄色人種は知能が劣る」という実証研究があったと聞いたことがあるけど、もし戦後の知能研究者が先行研究のメタ分析から事前分布をつくり、新たな実験データでそれを更新してたら、たとえ個々の実験データを単独でみたときには人種間に有意差がなかったとしても、「黄色人種は知能が劣る」という知見が量産されていたことになりませんかね? 言い換えると、すべての報告において過去知識のベイズ更新を試みるという姿勢は、社会なり組織なりにとって健全なのだろうか。ううむ...]
考察。
研究者は事前分布の選択において誠実でなければならない。ある事前分布を十分に正当化できないならばいろんな事前分布を使って報告しなければならない[←これ、よくいう話ですけど、ほんとにそういうことをやっているの、あんまり見たことないですけどね...]。
もちろん、ベイジアン事前分布はbad faithとして働きうる。もっとも頻度主義アプローチだって結果を知ったうえで仮説を組んでいるわけで、これだってbad faithだ。ベイジアン・アプローチのほうが透明なぶんまだましだ。云々。[←どうも話をずらされているような気がするんだけど...]
これから複雑なモデルを扱う人はベイジアンにならざるを得ないだろう。昔と違っていい本がたくさん出ているから読め。云々、云々。
論文:データ解析(2015-) - 読了:Zyphur & Oswald (2015) 経営科学のためのベイジアン統計学ユーザーズ・ガイド