読了: Tsai & Bockenholt (2011) 順位付け・一対比較をSEMで分析する、ついでに共変量も別の結果変数も組み込む

Tshi, R.C., Bockenholt, U. (2011) Understanding Choice Behavior Beyond Option Scaling Using Structural Equation Models. Journal of Data Science, 9, 427-444.

 またも一対比較の話。いいかげん飽きてきた…

 Maydeu-Olivares and Bockenholt(2005)を拡張し、順序づけデータの分析をSEMで分析する際に共変量とか含める、という主旨。
 流石に今回は、どんな話かだいたい見当がつくような気がするので、かなり端折ってメモする。

1. イントロダクション
[略]

2. モデル記述

2.1 Thurstonian 順序づけモデル
 評定者\(i\)が項目\(j\)について知覚した効用を\(\eta_{ij}\)とし、項目を縦に並べたベクトルを\(\mathbf{\eta}_i\)とする。項目ブロックについての順序づけ課題をやるんだけど、回答を一対比較の二値判断に直して\(w_{ijk}\)とし、その裏の潜在変数を\(y_{ijk}\)とし、ペアを縦に並べたベクトルを\(\mathbf{y}_i\)として、$$ \mathbf{y}_i = \mathbf{A} \mathbf{\eta}_i $$ とする。識別のため計画行列の一番右の列を削って\(\mathbf{A}^*\)とし、\(\mathbf{\eta}\)の最後の要素を削って\(\mathbf{\eta}^*\)とする。

2.2 順序づけデータとその他の指標のSEM
 ここからはSEMのモデルを考えます。

 測定モデル。ふつうは$$ \mathbf{y}_i = \mathbf{\nu} + \mathbf{\Lambda}_y \mathbf{f}_i + \mathbf{\epsilon}_i$$ですね。一対比較の場合、\(\nu\)は\(\mathbf{0}\)になり、\(\mathbf{\Lambda}_y\)は\(\mathbf{A}\)になり、\(\mathbf{f}\)は\(\mathbf{\eta}\)になり、\(\mathbf{\epsilon}\)は\(\mathbf{0}\)になるわけだけど、\(\eta\)の共分散構造を無制約にしたいから、かわりに$$ \mathbf{y}_i = \mathbf{A}^* \mathbf{\eta}_i^* $$ とする。
 構造モデル。ふつうは$$ \mathbf{f}_i = \mathbf{\kappa} + \mathbf{B}(\mathbf{f}_i – \mathbf{\kappa}) + \mathbf{\zeta}_i$$ ですね。回りくどい書き方をしているが、\(\mathbf{B}\)は対角0で、潜在変数同士の回帰を表す。一対比較の場合、とりあえず外生変数なしとすると、$$\mathbf{\eta}^* = \mathbf{\kappa}^* + \zeta^*_i $$となる。\(\zeta^*\)の共分散を\(\mathbf{\Psi}^*\)とする。
 以上まとめて、平均と共分散は$$ \mathbf{\mu}_y = \mathbf{A}^* \mathbf{\kappa}^*$$ $$ \mathbf{\Sigma}_y = \mathbf{A}^* \mathbf{\Psi}^* \mathbf{A}^{*\top}$$ となる。

 評定者の共変量ベクトル\(\mathbf{z}_i\)があるなら $$ \mathbf{\eta}^* = \Gamma_z \mathbf{z}_i + \mathbf{\zeta}^*_i$$ とする。MIMICモデルになりますね。
 評定者の順序づけ以外の反応ベクトル\(\mathbf{x}_i\)があるなら、別に\(\mathbf{x}_i = \Lambda_x \mathbf{\xi}_i + \delta_i\)というモデルを考える。
 以上をまとめよう。まず\(\mathbf{x}_i\)を導入する。構造モデルは$$ \left( \begin{array}{c} \eta^* \\ \xi \end{array} \right) = \left( \begin{array}{c} \kappa^* \\ \kappa_\xi \end{array} \right) + \left( \begin{array}{cc} \mathbf{0} & \Gamma_\xi \\ \mathbf{0} & \mathbf{0} \end{array} \right) \left( \begin{array}{c} \eta^* – \kappa^* \\ \xi \end{array} \right) + \left( \begin{array}{c} \zeta_{\eta^*} \\ \zeta_\xi \end{array} \right)$$ とすればいいんだけど、\(\xi\)の構造には別に関心ないから、平均\(\kappa_\xi\)は\(\mathbf{0}\)とし、識別のため共分散\(\Phi\)を単位行列\(\mathbf{I}\)にする。[んんん? 右辺第二項の右側上の\(\eta^* – \kappa^*\)ってなに? これ、いらなくない?]
 さらに\(\mathbf{z}_i\)を導入する。$$ \left( \begin{array}{c} \eta^* \\ \xi \end{array} \right) = \left( \begin{array}{c} \kappa^* \\ \mathbf{0} \end{array} \right) + \left( \begin{array}{cc} \mathbf{0} & \Gamma_\xi \\ \mathbf{0} & \mathbf{0} \end{array} \right) \left( \begin{array}{c} \eta^* – \kappa^* \\ \xi \end{array} \right) + \left( \begin{array}{c} \Gamma_z \\ \mathbf{0} \end{array} \right) + \left( \begin{array}{c} \zeta_{\eta^*} \\ \zeta_\xi \end{array} \right)$$ \(\zeta_{\eta^*}\)の共分散行列は\(\Psi^*\), \(\zeta_{\xi}\)の共分散行列は\(\Phi = \mathbf{I}\)である。
 というわけで、パラメータは\(\theta = \{\kappa^*, \Gamma_z, \Lambda_x, \Gamma_\xi, \Psi^*, \Theta_\delta\}\)。[最後の奴は\(\mathbf{x}_i\)の誤差項\(\delta_i\)の共分散行列であろう]
 
3. データ分析
3.1 データ例
[略]

3.2. 推定と検証
 限定情報ML法で推定できる。まず二値変数間の閾値とテトラコリック相関行列を推定し、次に得られた推定値とモデルに基づく指定とのずれの(重み付きorなしの)最小二乗関数を最小化する。[以降、推定と適合度指標の話が続くけどばっさりスキップ。疲れているのです]

3.3 識別制約
 比較判断データしかないとしよう。\(\kappa\)と\(\Psi\)ではなく\(\kappa^*\)と\(\Psi^*\)を推定する。識別のため、\(\Psi^*\)の左上、項目1の効用の分散を1に固定する。
 [ええええええええ?!やっぱそうなの?!]

 他の指標をいれたときは、さらなる識別制約について検討する必要がある。カテゴリカル変数が入っていると、連続潜在変数の残差分散をパラメータとして推定することが多いが、識別不能にならないよう、残差分散に十分な制約をかけることが多い。[とかなんとか、超面倒くさそうな話が書いてある。そこまでヒマじゃないのでパス]

3.4 結果

4. 結論
 今後の課題: モデル比較の際のS-B統計量の妥当性とパフォーマンスを、他のいろんな状況で検討する。
——————
 Mplusのコードを公開してくれていないかと探したが、見当たらなかった。

 ううううう。識別制約のかけ方についてのアドバイスが、第二著者の前の論文であるMaydeu-Olivares &Bockenholt(2005)と異なる… どういうことだ… 理不尽だ…
 この論文では、\(\eta\)の最後の要素を削りなさい、よって\(\kappa\)と\(\Psi\)ではなく\(\kappa^*\)と\(\Psi^*\)を推定なさい、識別のため項目1の効用の分散を1に固定しなさい、ってことになっている。それはわかるよ? それって、わりかし誰でも思いつく話だと思うよ?
 でもさ、あなたたち前の論文では、\(\eta\)をそのままモデルに入れちゃっていいよ、ただし\(\kappa\)の最後の要素を0に固定し、\(\Psi\)の項目1の分散を1, 最後の項目の分散を1, 最後の項目の共分散を0にしなさい、っていってたじゃん… へー、すごーい、よくわかんないけどそっちのほうがいいのか-、と、俺は素直に信じていたよ…

 この2つの制約は等価なのか? もしそうでないとしたら、どっちの制約がよいのか? 教えて偉い人…