読書日記: 読了：Bollen & Ting (2000) 因果指標のテトラッド・テスト

« 読了：Armstrong & Brodie (1999) マーケティングのための予測 | メイン | 読了：「人間はガジェットではない」 »

2011年5月24日 (火)

Bollen, K.A., Ting, K. (2000) A Tetrad test for causal indicators. Psychological Methods, 5(1), 3-22.
　統計的因果探索の有力株のひとつと名高い(そのわりにはあんまり使われていない)アプローチとして、CMUのTETRADプロジェクトがある。面白そうだからちょっと勉強しようと思って読んだ論文、なのだけれど、おなじTetradでもこれはconfirmatoryな使い方で、CMUのexploratoryな使い方とは方向性がちがう。。。ということに途中で気が付いた。アホだ。
　昨年、前勤務先での出張の移動中にだいたい読み終えていたのだが、新幹線の揺れが気持ちよかったらしく、書き込みのメモの字からみて完全に夢うつつだったようだし、中身を全然覚えていない。整理がつかないのでこのたび再読した。つくづくアホだ。

　BollenのCTA(confirmatory tetrad analysis)の基盤となる vanishing tetrad test を提案する論文。
　いまここに変数が4つあるとする。2変数のペアは6個。6つの共分散のうち4つを取りだし、たとえば以下のように組み合わせたものをテトラッドという。変数$x_i$と$x_j$の母共分散を$\sigma_{ij}$として、
　$\tau_{1234} = \sigma_{12} \sigma_{34} - \sigma_{13} \sigma_{24}$
　つまり、4つの変数を正方形に並べ、頂点を結ぶ線分で共分散を表すとして、このテトラッドは2本の縦線の積から2本の横線の積を引いたものである。テトラッドにはこのほかに、$\tau_{1342}$と$\tau_{1423}$がある。ええと、前者は縦線の積と斜め線の積の差、後者は横線の積と斜め線の積の差ですね。
　そんなことを考えてお前は何が楽しいのかという感じだが、面白いのはここからである。

この４つの変数があるひとつの潜在変数のreflectiveな指標であるとしよう。つまり、潜在変数から指標に向かって4本の矢印が伸びているとする。潜在変数の分散を$\Phi$、負荷を$\lambda_1, \lambda_2, \ldots$とすると、$\sigma_{ij}=\lambda_i \lambda_j \Phi $であるから、右辺の項はすべて$\lambda_1 \lambda_2 \lambda_3 \lambda_4 \Phi^2$となり、3つのテトラッドはすべて差引0になる。これをvanishing tetradという。個々の変数の負荷がなんであれ、誤差(独自因子)がどうであれ、テトラッドはとにかく消える、というところがポイントである。
こんどは、この４つの変数がある潜在変数のformativeな指標であったとしよう。つまり、潜在変数から矢印が伸びているのではなく、潜在変数に向かって矢印が伸びている場合だ。このときは、変数間の共分散はどんな値であってもおかしくないので、全変数が互いに独立でない限り(そしてよほど運が悪くない限り)、どのテトラッドも消滅しない。

　モデル構築の際、指標が潜在変数に対してreflectiveかformativeかというのは、一義的には概念上の問題である。潜在変数が動いたせいで指標が動くなら前者、逆なら後者だ。しかし現実にはどちらとも決めかねることが多いわけで、データからサポートを得たいと考えるのは人情である。一方、一般的な共分散構造分析の枠組みでは、矢印の向きを決める方法はない(ネストしてないから尤度比検定はできない)。そこでテトラッドを使えば、すくなくとも「４つ全部がreflective」か「4つ全部がformative」かという二択の問題については、3つの標本テトラッドを観察することによって判断できるわけだ。
　これを一般化してモデルの検証に使う、というのがCTAのアイデアである。指標が4つより多い場合にも少ない場合にも一般化できるし、矢印の向きだけでなく誤差相関の有無についても検討できる。
　ただし、CTAを使えばすべての矢印の向きがわかるという夢のような話ではない。たとえば「4つの指標のうち1つだけがformative」な場合も、やはり３つのテトラッドが消失するわけで、「4つ全部がreflective」な場合と区別することができない。また、仮に指標がformativeであることがわかったとして、そういうモデルがSEMで識別可能かどうかはまた別の問題である。

　第二著者がSASマクロを配布している模様。Rのパッケージがあるかどうかはわからない。一度つかってみたいなあ。

論文：データ解析(-2014) - 読了：Bollen & Ting (2000) 因果指標のテトラッド・テスト

読書日記

読んだ本を淡々と記録します

2011年5月24日 (火)