« 読了:「人間はガジェットではない」 | メイン | 読了:Shocker & Hall (1986) プリテスト・マーケット・モデル »
2011年5月26日 (木)
Hayduk,L., Cummings, G., Stratkotter, R., Nimmo, M., Grygoryev, K., Dosman, D., Gillespie, M., Pazderka-Robinson, H., Boadu, K. (2003) Pearl's d-separation: One more step into causal thinking. Structrual Equation Modeling, 10(2), 289-311.
統計データから因果関係を推測するという分野では、最近はPearlの枠組みについて学ぶのがもはや必須となっている模様なのだが、あいにく用語が独特で、俺のようなど素人には非常にハードルが高い。
よく引用されるPearl (2000) "Causality"には邦訳まで出ていて、仕方がないので大枚はたいて買い込んだものの、たとえば,重要概念であるd-分離(有向分離)についてのPearlの定義はこんな感じである:
道pが次の条件のいずれかを満たすとき,道pは頂点集合Zによって有向分離される(あるいはブロックされる)という。
(1)道pは,ある頂点mがZに含まれるような連鎖経路 i → m → j あるいは分岐経路 i ← m → j を含む。
(2)道pは,mもその子孫もZに含まれないような合流経路(または合流) i → m ← j を含む。
集合ZがXの頂点とYの頂点の間の全ての道をブロックするとき,集合ZはXとYを有向分離するという。(黒木訳「統計的因果推論」pp.16-17)
あはははははは。
この論文は哀れなSEMユーザに向けて,ただd-分離という概念だけについて,20頁近くを費やして徹底的な解説をお送りする,というもの。あんたらこれをきっかけにPearlの本を読むがいいさ,というきわめて啓蒙的かつお節介な論文である。Pearlの邦訳書にトライする前の景気づけに,と思って目を通した。
Hayduk先生は読者の知識レベルをちょっと低めに見積もっておられるようで... なんというか,内容よりも説明のテクニックについて学ぶところ多かった。いま俺は市場調査に関連する仕事をしているが,調査結果を解釈する人("リサーチャー")は日々多次元クロス表と悪戦苦闘している。それはそれで素晴らしいことではあるものの,あまりに無原則にデータを層別するのはselection biasの観点からみて危険なのであって,そのあたりの事情を理解してもらうにはどうしたらよいかと,あれこれ試行錯誤したことがあった。この論文では,(1)x+y=zとなるような3つの調査項目の実例を挙げ,(2)x, y, zからなる立方体のなかに平面z=x+yを描き,(3)任意のz=cについて立方体を水平に切り,その断面においてはy=-x+cであることを図示し,(4)つまりうかつにzで層別するとxとyのあいだに見かけ上の負の相関が生じるのです... というやりかたでビジュアルに説明している。これが案外わかりやすい。こういう絵を描けばよかったか。
この論文を読んでいちばん驚いたのは:パキスタンでテロリストに殺害されたダニエル・パールというジャーナリストがいたけれど,あの人はPearl 教授の息子さんだったのだそうだ。知らなかった。。。
論文:データ解析(-2014) - 読了:Hayduk,L.,et.al.(2003) d-分離:一歩進んだ因果的思考