elsur.jpn.org >

« 読了:Bethos, et al. (2009) アイデア市場プラットホームIDEM | メイン | 読了:「よつばと!」「たそがれメモランダム」「イムリ」「アイアムアヒーロー」「亜人ちゃんは語りたい」「闇金ウシジマくん」「さらばゲイツちゃん」 »

2015年12月 3日 (木)

Zyphur, M.J., Oswald, F.L. (2015) Bayesian Estimation and Inference: A User's Guide. Journal of Management, 41(2), 390-420.
 この雑誌のこの号は「経営科学におけるベイジアン確率・統計学」という特集号で、この論文は編者による啓蒙的内容。ちょっと事情があって目を通したんだけど、これ、31頁もあるやんか...

 この号の所収論文の題名をメモしておくと:

ほかに、Gigerenzerさん, Gelman大先生、Galavottiという人のEditorial Commentaryがついている。

 著者曰く、
 社会科学におけるベイジアン革命の意義は:(1)検証可能な仮説の範囲を広げ、帰無仮説有意性検定(NHST)に依存しない直観的な解釈を可能にする。(2)事前の知見と新データを結合できる。その結果は自動的にメタ分析となる。(3)事前の知見を使うことで、より小標本の研究を可能にする。(4)伝統的な推定方法なら複雑すぎて失敗するようなモデルでも推定できるようになる。
 伝統的アプローチは頻度主義の確率理論に依存している。そのせいで、ORにおいてはp値と信頼区間の混同が起きたり、小標本研究が抑制されたり、多くの統計モデルが推定不能になっていたりする。ベイジアン・アプローチをお勧めしたい。
 ふたつのアプローチを比較しよう...

 ...というわけで本編が始まるのだが、初心者向けの概観なので、以下メモは簡単に。

 前半の話の流れはこんな感じ。
 まず、ベイジアンはパラメータをデータの下での確率変数として捉えるのよという話。次にベイズのルールの話をして、事前分布$P(\theta)$, 尤度$P(z|\theta)$、事後分布$P(\theta|z)$を導入。
 事前分布を決めるのが難しい。次の3つがある。

  1. 情報事前分布。利点:過去の研究の知見を利用できる;小標本研究を促進;手元のデータから得られる尤度を事前分布で補うことができる。
  2. 経験事前分布。利点:たとえばマルチレベルモデリングで、全データでグループ平均を推定し、かつ一部のデータでパラメータを推定することができる。いっぽう、シングルレベルモデルではデータで尤度と事前分布の両方を推定していることになり、これはおかしい。
  3. 無情報事前分布。標準的なルールでつくった無情報事前分布のことを「客観事前分布」と呼ぶこともある。

 事前分布をどう更新するかというのを、コイン投げを例に紹介。[ここ、眠くて読んでない]
 いきなり、MCMCってのがあるんだよ、と紹介。詳しくは参考書を読め。[共役事前分布の話とかしないんだ... 時代だなあ]
 ベイジアン推論の例として2つ紹介。

  1. パラメータの事後分布から信用区間を求める。頻度主義的な信頼区間との違いを説明。
  2. モデル比較。posterior predictive checkingについて紹介。[この説明だけ読んでもよくわかんないけど、PPPってやつですね。モデル比較と云えばベイズ・ファクターの話になるかとおもったら、そっちは省略している。DICにもほとんど触れていない。へー、そういうものか]

 最後に、頻度主義との違いを整理。

  1. 頻度主義では確率は観察に適用されるのであってパラメータに適用されるのではない。
  2. 事前分布がない。
  3. サンプルサイズが小さいと、効果が大きくても帰無仮説を棄却できない。

 後半は、自分の昔の研究を取り上げてベイジアンでやりなおすというデモンストレーション。

 例1はSEM。5指標1因子(社会的身分)、その因子に外生変数(テスタトロン)からのパスが刺さるというモデル。Mplusで残差共分散を片っ端からベイズ推定したら(事前分布の分散は思い切り小さくするわけね)、テスタトロンの効果が小さくなった、とかなんとか。ちゃんと読んでないけど。[編者がこんなにMplus推しの解説をしているのと同じ号に、Stromeyer et al. のMuthen批判が載ったのか... すごいな]

 例2はANOVA。これは面白いのでちゃんとメモを取ろう。
 元論文は、先行する自己制御が将来のパフォーマンスに与える影響を調べたもの。自我消耗理論によれば、自己制御能力とは限定的な資源であり、使いすぎると枯渇してしまう。そこで実験。学生に{楽しい, 悲しい}ビデオを見せて、{感情的反応を抑圧するように教示(自己制御群), 非教示(統制群)}。で、陸軍の戦闘シミュレーションをさせて、判断の正しさ、課題遂行の所要時間、調べた属性の平均個数[←なんだかわからん]を測定。つまり、従属変数は3つ、2x2の被験者間2要因実験だ。対象者は全部で80人。
 元論文では各従属変数についてOLS回帰をかけた。いずれの変数でも、ビデオ種別と交互作用は有意でなかった。判断の正しさにおいてのみ、自己制御群が有意に低かった。これが一番大事な結果変数だったので、自我消耗理論の予測が支持されましたね、という結果ではあった。
 さて、欠点が二つある。まず、理論も先行研究もあるのに分析で使ってない。自己制御群は課題遂行時間が短くなり属性数が減るという仮説があるのに。また、小標本だったので、model-wideな最尤推定値ではなくてOLS推定値を使っている。ほんとうは3本まとめたパス解析をやったほうがいいのに。
 というわけで、Mplusでやりなおしましょう。自我消耗のメタ分析研究に基づき、パラメータと残差分散の情報事前分布を決める[うっわー。求め方が細かく書いてあるけどパス]。パス解析すると、果たして、どの変数においても要因の効果の信用区間は0を含みませんでした。つまり理論的予測がさらに強力に支持されました、云々。

 [うぐぐぐぐ。素朴な疑問なんだけど、こういう分析の意義はなんだろう? 先行研究のメタ分析から事前分布をつくって実験データで更新するという分析も確かに面白いけど、もし先行研究に知られざる系統的誤謬があったら、それを末永く引きずることになるわけで...早い話ですね、戦前のアメリカには「黄色人種は知能が劣る」という実証研究があったと聞いたことがあるけど、もし戦後の知能研究者が先行研究のメタ分析から事前分布をつくり、新たな実験データでそれを更新してたら、たとえ個々の実験データを単独でみたときには人種間に有意差がなかったとしても、「黄色人種は知能が劣る」という知見が量産されていたことになりませんかね? 言い換えると、すべての報告において過去知識のベイズ更新を試みるという姿勢は、社会なり組織なりにとって健全なのだろうか。ううむ...]

 考察。
 研究者は事前分布の選択において誠実でなければならない。ある事前分布を十分に正当化できないならばいろんな事前分布を使って報告しなければならない[←これ、よくいう話ですけど、ほんとにそういうことをやっているの、あんまり見たことないですけどね...]。
 もちろん、ベイジアン事前分布はbad faithとして働きうる。もっとも頻度主義アプローチだって結果を知ったうえで仮説を組んでいるわけで、これだってbad faithだ。ベイジアン・アプローチのほうが透明なぶんまだましだ。云々。[←どうも話をずらされているような気がするんだけど...]
 これから複雑なモデルを扱う人はベイジアンにならざるを得ないだろう。昔と違っていい本がたくさん出ているから読め。云々、云々。

論文:データ解析(2015-) - 読了:Zyphur & Oswald (2015) 経営科学のためのベイジアン統計学ユーザーズ・ガイド

rebuilt: 2020年11月16日 22:56
validate this page