« 読了:「中国共産党」 | メイン | 読了:Boettcher & Dethlefsen (2003) dealパッケージ »
2012年8月21日 (火)
Shadish, W.R. & Sullivan, K.J. (2012) Theories of causation in psychological science. Cooper, H., et al. (eds.), "APA Handbook of Research Methods in Psychology," Volume 1, Chapter 2. American Psychological Association.
心理学の研究者向けに(つまりは非専門家向けに)、Campbell, Rubin, Pearlらの因果推論の考え方を比較して紹介する論文。Pearlさんご自身がblogで紹介しているのを見つけて読んだ。
データ解析の文脈で因果推論について考えるとき、最近はRubinやPearlの道具立てについて理解することが必須となっているようである。とはいえ、素人向けの解説は多くないし、RubinのアプローチとPearlのアプローチを比較してくれる解説はさらに少ない。また、もともと心理学ではCampbellが提案した概念が有名で(内的妥当性と外的妥当性とか)、考えてみればこういうのも因果推論のための一種のガイドラインなのだが、正面からの解説はやはり多くない。というわけで、これはとても貴重なレビューだと思う。勉強になりましたです。
前半は3つのアプローチの紹介。書き方からして、Pearl流のアプローチが一番理解しにくいとお感じになられているようで、ご親切に重要キーワード・リストまでつくってくださっている(ちょっと笑ってしまった)。なお選定された重要キーワードは、ノード、エッジ、有向エッジ、双方向エッジ、DAG、親・子・先祖・子孫、合流点、d分離、バックドアパス、バックドア基準、fork of mutual dependence, inverted fork of mutual causation, そしてdo(x)オペレータである。
後半は、いくつかの側面について3つのアプローチを比較する。理解できなかった箇所も多いのだが、いちおうメモしておく。なお、著者らはCampbell流、Rubin流、Pearl流の因果モデルをそれぞれCCM, RCM, PCMと略記している。
- 哲学的側面...
- CCMは概念的・哲学的スコープがもっとも広い。CCMはミルの因果の哲学、ならびに実験研究の方法論と結びついている。またポパーに従い、仮説の反証という考え方を重視し、対立的説明を常に歓迎する。CCMは人間の可謬性を強調する。
- RCMは哲学とあまり結びついていない。RCMを反事実的な因果理論として捉える人は多いが、Rubin自身は自分のモデルをpotential outcomeという概念を用いた形式的な統計モデルと捉えている(potential outcomeは原理的には観察可能であり、実験において観察されないときに反事実になるのであって、それ自体は反事実ではない)。また反証という考え方もあまり重視されない。
- PCMは因果の記述ではなく説明を重視する。たしかにd分離やdo(x)オペレータは因果の記述のためのルールだが、PCMはむしろDAGの構築に焦点を当てている(ある意味でCCMやRCMより野心的である)。PCMはランダム化実験をなんら特別視しない。
- 効果の定義...
- CCMではもともと効果の定義があいまいだった。たいていの場合、効果は2つの事実のあいだの差(ランダム化試験における処理群と統制群の差)として捉えられていた。
- RCMは効果の定義がすごく明確。
- PCMにおける効果の定義は、DAGを構成する方程式を解き、do(x)オペレータを用いてX=xがYの確率分布の空間に与える効果を推定することに依存している。その意味ではCCMと似ている。しかし、PCMでは効果をX=x_0とX=x_1の間の効果の差として定義することもできる。
- CCMとRCMは、問題を統計で解決することよりもデザインで解決することを好むが、PCMは両方を同じくらい重視する。また、CCMとRCMは、選択バイアスが未知である状況で分析者が正しいDAGをつくれるかという点について懐疑的である。
- 原因の理論...
- CCMは原因についての理論に注目する。いっぽうRCMやPCMは原因にあまり注意を向けない。RCMは効果推定に焦点を絞っているし、PCMの文脈では原因は単なる記号ないし仮説例である。
- CCMは、原因の構成概念的妥当性を確立するために、単なる実験的操作についての知識以上のものを求める。Campbellにいわせれば、実験的操作なんていうのは処理という概念のごく一部にすぎない。実験における処理とは、さまざまな要素からなる多次元的なパッケージなのだ。原因とは、研究者が注目している特徴を含むさまざま特徴の集合体である(なにしろCampbellは社会心理学者なのである。社会心理学では、その実験的操作は理論的関心の対象である構成概念をほんとに反映しているのか、というところで揉めることが多い)。
- CCMとPCMは、操作不能なものも原因になりうると考える(ナントカ遺伝子とか)。RCMはこの点についてあいまいで、そこが論争の種になっている。
- 因果の一般化 (外的妥当性と構成概念妥当性) ...
- CCMは、構成概念妥当性と外的妥当性というかたちで、一般化可能性に強い関心を持つ。もともとCampbellは、一般化可能性は大事ですというだけで、それを研究する方法はMTMM行列くらいしか持ち合わせていなかった。Cook&Campbell(1979)になると構成概念妥当性の理論が拡張され、知見の一般化の方法はランダムサンプリング以外にもあるということになり、Shadish et al.(2002), Cook(2004)に至る。いまではメタ分析やメディエータの分析が重要になっている。
- RCMはメタ分析やメディエータの分析に貢献してきたが、因果の一般化という問題に直接かかわることはめったにない。数少ない例外として、メタ分析における応答曲面分析についてのRubinの研究(Rubin, 1990, 1992)がある (←ナンダソレハ...)
- PCMは因果の一般化という問題に直接かかわらない。ただし、因果的説明が一般化の鍵になるという意味で、DAGが一般化のための道具になることはありうる。
- 定量化...
- 定量化についてはPCMとRCMのほうがCCMより先を行っている(Rubinは統計学者、Pearlはコンピュータ科学者だから、当然である)。だがしかあし、CCMの影響下で開発されたMTMM行列の分析や回帰分断デザインを忘れてはいかん。云々。
- デザインと分析...
- CCMとRCMはどちらもデザインの良さを重視するが、CCMはデザイン、RCMは分析により焦点を当てる(例外は傾向スコアによるマッチング)。この二つは補完的である。
- PCMはデザイン(ランダム化実験かどうかとか)に関心を持たない。CCMやRCMとはちがい、非ランダム化実験でもランダム化デザインと同じ結果を得たい... というような発想はない。PCMは分析、ないしDAGを構築するための概念的作業に焦点を当てる。ただし、ここでいう概念的作業は、RCMがテストをバランス化させる際と同じく、結果についての知識なしに行われる作業であり、その意味ではデザインの問題である。
- まとめ...
- 3つのアプローチはあまりに言葉がちがいすぎるので、どんな研究者でも、3つのアプローチすべてを十分に理解した上で比較評価することはできないだろう(←えーっ)。
- CCMの中心的概念は妥当性への脅威を評価することだが、定量的評価の方法は提供してくれない。
- RCMでは「強い無視可能性」という想定が重要だが、RCMの内部ではそれを検証できない。また、良い観察研究のデザインとはどんなデザインかという点について十分な注意を払っていない。
- PCMでは、正しいDAGをどうやってつくるのかがわからない。また実践での成功事例が少ない。
...とかなんとか。途中で力尽きて、流し読みになってしまった。
哲学的側面のところでのコメントが面白かった:
皮肉なことに、この「我々は常に誤りうる」という感覚こそが、おそらくもっとも理論から実践へと移しにくい特徴なのである。いま準実験デザインの活用を声高に宣言している研究者の多くに、Campbellは欠陥を見出したであろう。傾向スコア分析を用いている研究者の多くは、「強い無視可能性」などの諸想定があてはまっているかどうかにあまり注意を向けない。因果推論を正当化する根拠としてPCMを引き合いに出しながら、モデルがもっともらしいことが大事だという点には触れない、という人はさらに多いだろう。かつてCampbell(1994)はこう言った:「私の方法論的勧告は、それを引用する人はあまりに多く、それに従う人はあまりに少なかった」
うわあ、あっちこっち痛い...耳とか胸とか...
論文:データ解析(-2014) - 読了:Shadish & Sullivan (2012) Cambell vs. Rubin vs. Pearl, 統計的因果推論の頂上決戦