読書日記: 読了：Little, Slegers, Card (2006) 潜在変数モデルを識別するためのeffect-coding制約

« 読了：Loffler (2014) 高級車の消費者支払意思額をPSMとコンジョイント分析で比較する | メイン | 読了：Alvarez, et al. (2014) 共分散行列の事前分布は逆ウィシャート分布でいいのか »

2017年8月25日 (金)

溜まった論文メモをちびちびアップ中。まだ5月分だ。なかなか片付かない...

Little, T.D., Slegers, D.W., Card, N.A. (2006) A non-arbitrary method of identifying and scaling latent variables in SEM and MACS models. Structural Equation Modeling, 13(1), 59-72.

　多群のSEMモデルでモデル識別のために制約を掛けるとき、因子分散を1にするのでもなければ最初の指標の負荷を1にするのでもない、新しい制約の掛け方をご提案します。それはeffect-codingです！という論文。仕事の都合で読んだ。

　準備。
　$X$を長さ$p$の観察ベクトルとし、その平均ベクトルを$\mu$, 分散共分散行列を$\Sigma$とする。群$g=1, \ldots, G$があり、群$g$に属する観察ベクトルを$X^g$とする。次のモデルを考える。
　$X^g = \tau^g + \Lambda^g \xi^g + \delta^g$
$\tau^g$は長さ$p$の切片ベクトル、$\Lambda^g$は$(p \times r)$の負荷行列, $\xi^g$ [原文には$\chi^g$という表記も混在している] は長さ$r$の潜在ベクトル、$\delta^g$は長さ$p$の独自因子ベクトル。平均構造と共分散構造は
　$\mu^g = \tau^g + \Lambda^g \kappa^g$
　$\Sigma^g = \Lambda^g \Phi^g \Lambda^{g'} + \theta^g$
$\kappa^g$は長さ$r$の潜在変数平均ベクトル, $\Phi^g$は$(r \times r)$の潜在変数共分散行列、$\theta^g$[$\theta^g_\delta$という表記も混在している]は独自因子の分散を表す$(p \times p)$の対角行列である。
　以下のように仮定する。$E(\delta)=0$。$Cov(\delta\delta')=0$。独自因子と共通因子は独立。観察変数と独自因子はMVNに従う。
　測定モデルは本質的同族(essentially congeneric)と仮定する。つまり、所与の潜在変数の指標の切片$\tau$についても、所与の潜在変数の指標$\lambda$についても、独自分散$\theta$についても制約しない、広い範囲の測定モデルについて考える。というか、測定不変性の制約をどこまでかけるか、それをどうやって決めるかは、この論文のテーマではない。この論文が問題にするのは、モデル識別のための制約をどうやってかけるか、である。

　本題。
　モデル識別のための制約のかけかたが3つある。

　方法1: 参照群法。
　群1の潜在変数平均ベクトル$\kappa^1$を0に固定し、群1の潜在変数共分散行列$\Phi^1$の対角要素を1に固定する。負荷$\Lambda^g$と切片$\tau^g$に群間等値制約をかければ、潜在変数の平均と分散は群2以降で自由推定できる。
　このとき、$\tau$は群1の平均の推定になる。群2以降の潜在変数平均ベクトル$\kappa^2, \ldots, \kappa^G$は、その潜在変数の指標群の平均差を負荷で重みづけたものとなる。
　また、個々の潜在変数の負荷$\lambda$は、群1での負荷となる。群2以降の潜在変数分散$\Phi^g$は、その潜在変数で説明された共通分散を比で表したものになる。

　方法2: マーカー変数法。いうならば、切片・負荷のdummy-codingである。
　個々の潜在変数について、その(たとえば)最初の指標を選んで、その切片$\tau^g_{1r}$を0に固定し、負荷$\lambda^g_{1r}$を1に固定する。残りの負荷と切片には群間等値制約をかける。この方法は、潜在変数のスケールを最初の指標に合わせたことになる。選ぶ指標は別にどれでもよい。ふつうはどの指標を選んでも適合度は変わらない。(ただし、すごく無制約なモデルは例外で...と、Millsap(2001 SEM)を挙げている。これ、どっかで聞いたことがあるなあ...)

　方法3: effect-coding法。
　個々の潜在変数について、指標の切片の和を0、負荷の平均を1と制約する。つまり、潜在変数$r$の指標の数を$I$として
　$\sum_i^I \lambda^g_{ir}=I, \ \ \sum_i^I \tau^g_{ir} = 0$
これだけでもモデルは識別できる。この方法だと、潜在変数の分散は、その潜在変数で説明された分散の重みつき平均となり、潜在変数の平均は、その潜在変数の指標の平均の重みつき平均となる。その重みが合計1になるように最適化されているわけである。

　計算例...[略]

　比較すると、

参照群法は、因子平均の群間比較の際にわかりやすい。また、群1だけは、潜在変数の共分散が相関係数になる。[ここで、全群で分散1の高次因子であるphantom潜在変数をつくるという手が紹介されている... いま関心ないのでパスするけど、Little (1997, MBR)をみるといいらしい]
マーカー変数法は指定が簡単。しかし、潜在変数のスケールが、マーカー指標の選択によって変わってくるという欠点がある。また、群間の測定不変性を検定するときは、マーカー変数だけは不変だという前提を置くことになる。
effect-coding法は、潜在変数のスケールが最適化されている。また、全指標が同尺度だと考えることができるならば、その尺度が潜在変数にも保持されていると考えられるわけで、潜在変数間で因子平均・因子分散を比較できる[←ああ、なるほど...]。また、どれかの群を参照群に選ぶ必要がない。測定不変性が仮定されていない場合でも使いやすい[←ここ、説明があったんだけどパス]。いっぽう、指標の尺度がバラバラだったらあまり好ましくない。

　なお、以上の3種類でモデルの適合度は変わらないし、潜在変数の差の効果量も変わらない。
　
　なお、ここまで多群モデルについて考えてきたが、この話は縦断モデルにも適用できる。
　以上の議論は単純構造がある場合の話で、交差負荷がある場面については今後の課題である。云々。

　... なぜこの論文を読んでいるのか途中から自分でもよくわかんなくなっちゃったんだけど、ま、勉強になりましたです。
　多群SEMでeffect-codingしたくなる状況ってのがいまいちピンときてないんだけど、たとえば全指標の尺度が同じで、交差負荷のないCFAで、かつ切片と負荷の群間等値制約を掛けている(ないし、その指標についても外している)ような場面では、それはわかりやすいかもなと思う。もっとも、たとえば測定の部分不等性を捉えるために、一部の指標についてだけ負荷の等値制約を外しているような場面では、いくら適合度は変わらないといえ、負荷の平均を1に揃えるというのはなんだか奇妙な話だと思う。
　ま、いずれ使いたくなる場面に出くわすかもしれないな。覚えておこう。

　ところで、我らがMplusはどうなっているかというと... 私の理解が正しければ、Mplusのデフォルトは、
　「因子負荷は最初の指標で1に固定、切片は定数制約なし、因子平均は第1群で0に固定、因子分散は制約なし、指標の切片と因子負荷は群間等値」
なので、参照群法とマーカー変数法の中間といったところ。もちろん、参照群法、マーカー変数法、effect-coding法のいずれのモデルも組めるはずである。

論文：データ解析(2015-) - 読了：Little, Slegers, Card (2006) 潜在変数モデルを識別するためのeffect-coding制約

読書日記

読んだ本を淡々と記録します

2017年8月25日 (金)