読了:Tsai(2003) 一対比較データに選好の個人差があるThurstonianモデルを当てはめるときの識別性について

Tsai, R.C. (2003) Remarks on the Identifiability of Thurstonian Paired Comparison Models under Multibple Judgments. Psychometrika, 68(3), 361-372.

 比較課題から刺激の効用を推定するときのモデルの識別性について悩むところ多く、なにかの足しになるかと思って読んでみた。先日読んだMaydeu-Olivares & Bockenholt(2005) で引用されていた論文。

1. イントロダクション
[略]

2. Thustonian一対比較モデル

 \(r\)個の項目の総当たり比較について考える。対象者\(i\)が項目\(j, k\)を比較しておこなう潜在判断\(y_{ijk}\)が $$ y_{ijk} = y_{ij(k)} – y_{ik(j)}$$ $$ y_{ij(k)} = \mu_j + \nu_{ij} + \epsilon_{ij(k)}$$ $$ y_{ik(j)} = \mu_k + \nu_{ik} + \epsilon_{ik(j)}$$ であるとする。\(\epsilon_{ij(k)}, \epsilon_{ik(k)}\)は独立とする。
 一対比較反応(二値)を\(w_{ijk}\)とし、\(y_{ijk} \geq 0\)のときそのときに限り1とする。\(\epsilon_{ijk} = \epsilon_{ij(k)} – \epsilon_{ik(j)} \)とする。

 対象者\(i\)の潜在判断のベクトル(長さ\(C(r,2)\))を\( \mathbf{y}_i = (y_{i12}, y_{i13}, \ldots, y_{i(r-1)r})^\top \) とする。同様に、一対比較反応(二値)のベクトル\( \mathbf{w}_i\)、[ペアの誤差項の]ベクトル\(\mathbf{\epsilon}_i\)を考える。またベクトル\(\mathbf{\mu}\), ベクトル\(\mathbf{\nu}_i\)を考える[こっちは長さ\(r\)]。
 \(\mathbf{\epsilon}_i \sim N(\mathbf{0}, \mathbf{\Psi}), \mathbf{\nu}_i \sim N(\mathbf{0}, \mathbf{\Sigma}_\nu)\)とする。\(\mathbf{\epsilon}_i\)と\(\mathbf{\nu}_i\)は独立とする。\(\mathbf{\Psi}\)は対角行列とする。

 \(\mathbf{y}_i\)は\(C(r, 2)\)次元のMVNに従う。その平均と共分散は、一対比較の計画行列を\(\mathbf{A}^*\)として $$ \mathbf{\mu}_y = \mathbf{A}^* \mathbf{\mu} $$ $$ \mathbf{\Sigma}_y = \mathbf{A}^* \mathbf{\Sigma}_\nu \mathbf{A}^{*\top} + \mathbf{\Psi} $$ と書ける。計画行列の一番右の列を削った行列を\(\mathbf{A}\)とし、\(\mathbf{C} = [\mathbf{I}_{r-1} \ \ \mathbf{-1}]\)とすると、\(\mathbf{A}^* = \mathbf{AC}\)と書ける。たとえばこうである。$$ \mathbf{A}^* = \left( \begin{array}{ccc} 1 & -1 & 0 \\ 1 & 0 & -1 \\ 0 & 1 & -1 \end{array} \right), \ \ \mathbf{A} = \left( \begin{array}{cc} 1 & -1 \\ 1 & 0 \\ 0 & 1 \end{array} \right), \ \ \mathbf{C} = \left( \begin{array}{ccc} 1 & 0 & -1 \\ 0 & 1 & -1 \end{array} \right) $$ [\(\mathbf{A}^*\)は\(r \times r\)の計画行列で、各行には\(1\)と\(-1\)がひとつずつ入る。よってフルランクでない。\(\mathbf{A}\)はその右端の列を削った\(r \times r-1\)の行列。削られた右端列は、残った列のなかに1と-1が両方合ったら0, 1しかなかったら-1, -1しかなかったら1だから、残った要素を-1倍して合計した値にすればよい。つまり、\(\mathbf{C}\)は単位行列の右に、-1が並んだ列を付け加えた奴にすればいいのだ。頭いいね]
 もしペアへの判断プロセスにおけるペアごとの分散がペア間で等しいと仮定すれば、\(\mathbf{\Psi} = \omega^2 \mathbf{I}\)と書ける。

 データの離散的性質のせいで、\(\Sigma_y\)は識別できない。その相関行列のみが識別できる。Maydeu-Olivars(2001 Psychometrika)は、$$ \mathbf{\Psi} = \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_v \mathbf{A}^{*\top}) $$ とすることで\(\mathbf{y}\)を強制的に標準化するという方法を提案している。[←なるほど、\(\Sigma_y\)の対角を1とするために辻褄を合わせるということか。これってMplusでいうところのdelta approachだろうか?]

 さらに、判断が差としての構造を持っているので、\(\sigma_{ij}\)と\(\sigma_{ij}^* = \sigma_{ij} + d_i + d_j\)を区別できない。Arbuckle & Nugent (1973 Brit.J.Math.Stat.Psych.), Tsai(2000 Psychometrika)をみよ)。
 つまり、\(\mathbf{\kappa} = \mathbf{C\nu}\)として、\(\mathbf{\beta} = \mathbf{C\mu}, \mathbf{\Sigma}_\kappa = \mathbf{C} \mathbf{\Sigma}_\nu \mathbf{C}^\top\)だけが識別できる。
 [書き方が難しくて混乱したけど、みなさまお望みの長さ\(r\)のベクトル\(\mathbf{\mu} = (\mu_1, \mu_2, \ldots, \mu_r)^\top\)の推定値は手に入りませんよ、\(\mathbf{\beta} = (\mu_1 – \mu_r, \mu_2 – \mu_r, \ldots, \mu_{r-1} – \mu_r)^\top\)の推定値だけが手に入ります。\(\mathbf{\nu}_i\)の共分散行列も手に入りませんよ、\(\mathbf{\kappa}_i = (\nu_1 – \nu_r, \ldots, \nu_{r-1} – \nu_r)^\top\)の共分散行列だけが手に入ります。という話であろう]

3. \((\Sigma_\nu, \Psi)\)の等価性

 共分散行列\( (\Sigma_Z, \Psi_Z) \) と \( (\Sigma_X, \Psi_X) \)がおなじ相関行列をもたらすとき、つまり\(Corr(A^* \Sigma_X A^{*\top} + \Psi_X) = Corr(A^* \Sigma_Z A^{*\top} + \Psi_Z)\)のとき、\( (\Sigma_Z, \Psi_Z) \equiv (\Sigma_X, \Psi_X) \)とする。
 いまペア特有の分散が全てのペアで同じで、\( \Psi = \omega^2 \mathbf{I} \) かつ \(\omega^2 = 1\)ならば、
\( (\Sigma_1, \mathbf{I}) \equiv (\Sigma_2, \mathbf{I}) \)である必要十分条件は、なんらかのベクトル\(\mathbf{d}\)について\(\Sigma_1 = \Sigma_2 + \mathbf{d} \mathbf{1}^\top + \mathbf{1} \mathbf{d}^\top\)が成り立つことである。Thai & Bockenholt(2002 Math.Soc.Sci.)をみよ。
 以下ではこれを拡張する。

[Thurstonian共分散構造モデルが等価である必要十分条件]

 系1. \( \Sigma_1, \Sigma_2\)を\(r \times r\)共分散行列, \(\Psi_1, \Psi_2\)を\(C(r,2) \times C(r,2)\)の正則対角行列とする。\(\mathbf{A}\)を\(C(r,2) \times r-1\)のフルランクの一対比較計画行列とし、\(\mathbf{C} = [ \mathbf{I}_{r-1} \ \mathbf{-1} ] \)とする。
 \( (\Sigma_1, \Psi_1) \equiv (\Sigma_2, \Psi_2)\)である必要十分条件は、なんらかの正の定数\(c\)とベクトル\(\mathbf{d}\)について、以下が成り立つことである。$$ \Sigma_1 = c \Sigma_2 + \mathbf{d} \mathbf{1}^\top + \mathbf{1} \mathbf{d}^\top$$ $$ \Psi_1 = c \Psi_2 $$
 証明。[以下、私にもわかるように大幅に加筆している。そのせいで誤りが含まれているかも]

  • 後件⇒前件を証明する。
     仮に、なんらかの定数\(c\)とベクトル\(\mathbf{d}\)について\(\Sigma_1 = c \Sigma_2 + \mathbf{d} \mathbf{1}^\top + \mathbf{1} \mathbf{d}^\top\)かつ\(\Psi_1 = c \Psi_2\)が成り立っているとしよう。このとき、サイズ\(C(r, 2) \times r\)の一対比較計画行列\(\mathbf{A}^*\)について$$ \mathbf{A}^* \Sigma_1 \mathbf{A}^{*\top} = \mathbf{A}^* (c \Sigma_2 + \mathbf{d} \mathbf{1}^\top + \mathbf{1} \mathbf{d}^\top) \mathbf{A}^{*\top} = c \mathbf{A}^\top \Sigma_2 \mathbf{A}^{*\top}$$ が成り立つから、$$ \mathbf{A}^* \Sigma_1 \mathbf{A}^{*\top} + \Psi_1 = c(\mathbf{A}^\top \Sigma_2 \mathbf{A}^{*\top} + \Psi_2) $$ 共分散行列を一律にc倍しても相関行列は変わらないから、$$ Corr(\mathbf{A}^* \Sigma_1 \mathbf{A}^{*\top} + \Psi_1) = Corr(\mathbf{A}^\top \Sigma_2 \mathbf{A}^{*\top} + \Psi_2) $$ 定義より\((\Sigma_1, \Psi_1) \equiv (\Sigma_2, \Psi_2)\)だ。
  • 前件⇒後件を証明する。長いぞ、歯を食いしばれ。
     仮に\((\Sigma_1, \Psi_1) \equiv (\Sigma_2, \Psi_2)\)だとしよう。定義より$$ Corr(\mathbf{A}^* \Sigma_1 \mathbf{A}^{*\top} + \Psi_1) = Corr(\mathbf{A}^\top \Sigma_2 \mathbf{A}^{*\top} + \Psi_2) $$ である。\(\Sigma_x = \mathbf{A} \Sigma_1 \mathbf{A}^{*\top}, \Sigma_y = \mathbf{A} \Sigma_2 \mathbf{A}^{*\top}\)と略記し、さらに\(\mathbf{P}^{-2}_x = \mathrm{Diag}(\Sigma_x + \Psi_1), \mathbf{P}^{-2}_y = \mathrm{Diag}(\Sigma_x + \Psi_2)\)とすると、上の式は $$ \mathbf{P}_x (\Sigma_x + \Psi_1) \mathbf{P}_x = \mathbf{P}_y (\Sigma_y + \Psi_2) \mathbf{P}_y$$ と書き直せる。ここから、$$ \Sigma_x + \Psi_1 = \mathbf{P}^{-1}_x \mathbf{P}_y (\Sigma_y + \Psi_2) \mathbf{P}_y \mathbf{P}^{-1}_y$$ \(\mathbf{P} = \mathbf{P}^{-1}_x \mathbf{P}_y\)と略記すると$$ \Sigma_x + \Psi_1 = \mathbf{P} \Sigma_y \mathbf{P} + \mathbf{P}^2 \Psi_2$$ もとの表記に戻すと $$ \mathbf{A}^* \Sigma_1 \mathbf{A}^{*\top} + \Psi_1 = \mathbf{P} \mathbf{A}^* \Sigma_2 \mathbf{A}^{*\top} \mathbf{P} + \mathbf{P}^2 \Psi_2$$ \(\mathbf{A}^* = \mathbf{AC}\)より $$ \mathbf{AC} \Sigma_1 \mathbf{C}^\top \mathbf{A}^\top + \Psi_1 = \mathbf{P} \mathbf{A} \mathbf{C} \Sigma_2 \mathbf{C}^\top \mathbf{A}^{\top} \mathbf{P} + \mathbf{P}^2 \Psi_2$$ \(\Sigma_l = \mathbf{C} \Sigma_2 \mathbf{C}^\top, \Sigma_r = \mathbf{C} \Sigma_1 \mathbf{C}^\top\)として $$ \mathbf{A} \Sigma_r \mathbf{A}^\top + \Psi_1 = \mathbf{P} \mathbf{A} \Sigma_l \mathbf{A}^{\top} \mathbf{P} + \mathbf{P}^2 \Psi_2$$ 移項して$$ \mathbf{P} \mathbf{A} \Sigma_l \mathbf{A}^\top \mathbf{P} = \mathbf{A} \Sigma_r \mathbf{A}^\top + \Psi_1 – \mathbf{P}^2 \Psi_2$$ Tsai & Bockenhold(2002)が示したところによれば、なんらかの対角行列\(\Phi\)について\(\mathbf{P} \mathbf{A} \Sigma_l \mathbf{A}^\top \mathbf{P} = \mathbf{A} \Sigma_r \mathbf{A} + \Phi\)が成り立つならば、\(\Phi = \mathbf{0}\)である。従って、$$ \Psi_1 = \mathbf{P}^2 \Psi_2 $$ $$ \mathbf{A} \Sigma_r \mathbf{A}^\top = \mathbf{P} \mathbf{A} \Sigma_l \mathbf{A}^\top \mathbf{P}$$ である。
     1本目の式が表しているのはこういうことだ。\(\mathrm{diag}(\Psi_1) = (\psi^2_{1,1}, \psi^2_{1,2}, \ldots)^\top, \mathrm{diag}(\Psi_2) = (\psi^2_{2,1}, \psi^2_{2,2}, \ldots)^\top, \mathrm{diag}(\mathbf{P}) = (p_1, p_2, \ldots)^\top\)とすると、$$ \frac{\psi^2_{1,i}}{\psi^2_{2,i}} = p^2_i$$ 2本目の式が表しているのはこういうことだ。\(\mathbf{A}\)の\(i\)行目を\(\mathbf{a}_i\)として、$$ \frac{ \mathbf{a}_i \Sigma_r \mathbf{a}^\top_i }{ \mathbf{a}_i \Sigma_l \mathbf{a}^\top_i } = p^2_i$$ $$ \frac{ \mathbf{a}_i \Sigma_r \mathbf{a}^\top_j }{ \mathbf{a}_i \Sigma_l \mathbf{a}^\top_j } = p_i p_j$$ つまり、\(\mathbf{A} \Sigma_r \mathbf{A}^\top\)を成分表記すると、対角成分は、たとえば\((1, 1)\)なら\(p^2 \mathbf{a}_1 \Sigma_l \mathbf{a}^\top_1\)となり、非対角成分は、たとえば\((1,2)\)なら\(p_1 p_2 \mathbf{a}_1 \Sigma_l \mathbf{a}^\top_2\)となる。
     [ここから先、学力不足で理解できない… 涙とともに中略]

 系1がいっているのはこういうことである。モデルAの共分散構造が$$ \Sigma_A = \left( \begin{array}{ccc} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{array} \right), \Psi_B = \left( \begin{array}{ccc} 0.2 & 0 & 0 \\ 0 & 0.3 & 0 \\ 0 & 0 & 0.5 \end{array} \right) $$ モデルBの共分散構造が $$ \Sigma_B = \left( \begin{array}{ccc} 2.5 & 0 & 0 \\ 0 & 1.5 & -0.5 \\ 0 & -0.5 & 1.5 \end{array} \right), \Psi_B = \left( \begin{array}{ccc} 0.4 & 0 & 0 \\ 0 & 0.6 & 0 \\ 0 & 0 & 1 \end{array} \right) $$ だとしよう。実はこの二つのモデルは等価である。なぜなら $$ \Sigma_B = 2 \Sigma_A + \left( \begin{array}{c} 1 \\ 1 \\ 1 \end{array} \right) \left(\begin{array}{ccc} 0.25 & -0.25 & -0.25 \end{array} \right) + \left(\begin{array}{c} 0.25 \\ -0.25 \\ -0.25 \end{array} \right) \left(\begin{array}{ccc} 1 & 1 & 1 \end{array} \right) $$ $$ \Psi_B = 2 \Psi_A $$ だから。

[Maydeu-Olivars(2001 Psychometrika)の標準化をやったらどうなるか]
 では、\( \mathbf{\Psi} = \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_\nu \mathbf{A}^{*\top}) \)と制約したらどうなるか。

 系2. \( \Sigma_1, \Sigma_2\)を\(r \times r\)共分散行列とする。
 \( (\Sigma_1, \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_1 \mathbf{A}^{*\top})) \equiv (\Sigma_2, \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_2 \mathbf{A}^{*\top}))\)である必要十分条件は、なんらかの正の定数\(c\)とベクトル\(\mathbf{d}\)について、以下が成り立つことである。$$ \Sigma_1 = \Sigma_2 + \mathbf{d} \mathbf{1}^\top + \mathbf{1} \mathbf{d}^\top$$
 [証明。パス]

[Maydeu-Olivars(2001 Psychometrika)の標準化と等価なモデル集合]
 次に、Thurstonian共分散構造モデルのうち\( \mathbf{\Psi} = \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_\nu \mathbf{A}^{*\top}) \)というモデルと等価な下位集合を取り上げる。

 系3. \( \Sigma_1, \Sigma_2\)を\(r \times r\)共分散行列とする。 \(\Psi\)を\(C(r,2) \times C(r,2)\)の正則対角行列とする。
 \( (\Sigma_1, \Psi) \equiv (\Sigma_2, \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_2 \mathbf{A}^{*\top}))\)である必要十分条件は、なんらかのベクトル\(\mathbf{d}\)について、以下がなりたつことである。$$ \Sigma_1 = c \Sigma_2 + \mathbf{d} \mathbf{1}^\top + \mathbf{1} \mathbf{d}^\top$$ $$ \Psi = c \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_1 \mathbf{A}^{*\top}) $$
 [証明。パス]

 系3が示しているのは、\( \mathbf{\Psi} = \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_\nu \mathbf{A}^{*\top}) \)という制約によって\(\mathbf{\Sigma}_\nu\)の適切な推定量が手に入るのは、\(\mathbf{\Psi}\)の構造が\( c \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_1 \mathbf{A}^{*\top}) \)に従っているときだけだ、ということである。この識別制約は多くの場合強すぎて、\(\mathbf{\Psi}\)のパラメータ空間の全体をカバーできない。
 たとえば、真の共分散構造 \( (\mathbf{\Sigma}_1, \mathbf{\Psi}_1) \)が $$ \Sigma_1 = \left( \begin{array}{ccc} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array} \right) $$ だったとしますね。識別のため、\( \mathbf{\Psi} = \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma} \mathbf{A}^{*\top}) \) という制約をかけたとしましょう。このとき、\( \Psi_1 \)の適切な推定量が得られるのは、$$ \mathbf{\Psi}_1 = c \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_1 \mathbf{A}^{*\top}) = \left( \begin{array}{ccc} c-3 & 0 & 0 \\ 0 & c-4 & 0 \\ 0 & 0 & c-5 \end{array} \right) $$ が成り立っているときのみである。
 [図を使った説明。よくわからんかった…]

[Case V 等価クラスとの関係]
 系4. [省略]
 [証明。パス]

 系4が示しているのは、\( \mathbf{\Psi} = \mathbf{I} – Diag(\mathbf{A}^* \mathbf{\Sigma}_\nu \mathbf{A}^{*\top}) \)という制約を持つ共分散構造と\( \mathbf{\Psi} = \mathbf{I} \)という制約を持つ共分散構造との間に等価関係が成り立つ必要十分条件は、\(\mathbf{\Sigma}_\nu\)がTsai(2000)のいうCase V等価クラスに属していることだ、ということである。
 […中略…] 

4. パラメータ識別性

 前章では共分散構造のことだけ考えたが、ここからは平均構造のことも同時に考える。
 \( (\mu_Z, \Sigma_Z, \Psi_Z) \)と \( (\mu_X, \Sigma_X, \Psi_X) \) がもたらす\(\mathbf{w}\)の確率分布が同じである時、\( (\mu_Z, \Sigma_Z, \Psi_Z) \equiv (\mu_X, \Sigma_X, \Psi_X) \)とする。
 また、次のように定義する。$$ \mathbf{D}_X = \{ Diag(\mathbf{A}^* \mathbf{\Sigma}_X \mathbf{A}^{*\top} + \mathbf{\Psi}_X) \}^{-\frac{1}{2}}$$ $$ \mathbf{D}_Z = \{ Diag(\mathbf{A}^* \mathbf{\Sigma}_Z \mathbf{A}^{*\top} + \mathbf{\Psi}_Z) \}^{-\frac{1}{2}}$$ $$ [(\mathbf{\mu}_Z, \mathbf{\Sigma}_Z, \mathbf{\Psi}_Z)] = \{ (\mathbf{\mu}_X, \mathbf{\Sigma}_X, \mathbf{\Psi}) | \mathbf{D}_X \mathbf{A} \mathbf{\mu}_X = \mathbf{D}_Z \mathbf{A} \mathbf{\mu}_Z, (\mathbf{\Sigma}_X, \mathbf{\Psi}_X) \equiv (\mathbf{\Sigma}_Z, \mathbf{\Psi}_Z) \} $$ [日本語に書き直そう。項目効用の期待値ベクトル\(\mathbf{\mu}\), 項目効用の共分散行列\(\mathbf{\Sigma}\), 項目ペア誤差の共分散行列\(\mathbf{\Psi}\)の組をモデルと考える。モデルZがあるとき、そいつと\(\mathbf{\Sigma}\)と\(\mathbf{\Psi}\)は同じで、かつ\(\mathbf{D}_X \mathbf{A} \mathbf{\mu}_X = \mathbf{D}_Z \mathbf{A} \mathbf{\mu}_Z\)が成り立つようなモデルXの集合を、\([(\mathbf{\mu}_Z, \mathbf{\Sigma}_Z, \mathbf{\Psi}_Z)]\)と書くよ、といっているわけだ。ただし\(\mathbf{A} \mathbf{\mu}_Z\)とは、項目効用の期待値ベクトルの左から計画行列を掛けたもの、つまり項目ペアに対する潜在反応の期待値ベクトルで、\(\mathbf{D}_X\)とは潜在反応の共分散行列の対角の平方根の逆数、つまり潜在反応のSDの逆数だ。いいかえると、項目効用の共分散行列も項目ペア誤差の共分散行列も同じで項目ペアへの潜在反応の期待値もそのSDで割れば同じであるようなモデルの集合、ということであろう。
 ここでよくわかんないのは、式の右辺の\(\mathbf{A}\)が\(\mathbf{A}^*\)でないという点である。\(\mathbf{A}\)は本来の計画行列\(\mathbf{A}^*\)から右端列を取り除いた\(r-1\)列の行列ですよね?ってことは、\(\mathbf{A}\)を左から掛けられている項目効用の期待値ベクトルも\(\mu_X, \mu_Z\)も長さ\(r-1\)だ。いっぽう、項目効用の共分散行列\(\mathbf{\Sigma}_X, \mathbf{\Sigma}_Z\)は両側から\(\mathbf{A}^*\)とその転置行列が掛けられているから、サイズは\(r \times r\)だ。つじつまが合わなくないですか?]

 [ここから難しくなるので逐語訳]
上記の等価性に基づき、以下のようにいえる。自然に識別できるパラメータは、平均の差を標準化したもの$$ \frac{\delta_{jk} }{(\gamma_{jk} + \psi^2_{jk})^{1/2}} $$ ならびに差の相関 $$ \frac{\gamma_{jk, hl}}{ (\gamma_{jk}+\psi^2_{jk})^{1/2} (\gamma_{hl}+\psi^2_{hl})^{1/2} } $$ である。ただし、$$ \delta_{jk} = \mu_{j} – \mu_{k} $$ $$ \gamma_{jk} = \sigma^2_j + \sigma^2_k – 2\sigma_{jk} $$ $$ \gamma_{jk, hl} = \sigma_{jh} – \sigma_{jl} – \sigma_{kh} + \sigma_{kl} $$ であり、\(\psi^2_{jk}\)はペア\((j,k)\)に対応する\(\Psi\)の対角要素である。[複雑だ…ついて行けない…]
 しかし、解釈のしやすさという観点からいえば、被験者内変動と被験者間変動を別のパラメータとして表すような他の等価なパラメータ集合が存在する。それは、尺度化された平均差 \( \frac{\delta_{jk}}{\psi^2_{12}} \), 被験者間の刺激変動と\(\psi^2_{12}\)との比 \( \frac{\gamma_{jk}}{\psi^2_{12}} \), ペアごとの分散の比\( \frac{\psi^2_{jk}}{\psi^2_{12}}\), 刺激の差の尺度化された共分散 \( \frac{\gamma_{jk,hl}}{\psi^2_{12}} \)である。
 潜在判断\(\mathbf{y}\)は、その尺度も位置も識別できない。この不定性問題を減少させるために次のアプローチを採ろう。位置を固定し(たとえば\(\mu_r=0\)), 最初の比較の被験者内反応の尺度を固定する(たとえば\(\psi^2_{12} = 1\))。系1より、この2つの識別制約の下で、不定性の問題は\(\Sigma_\nu \equiv \Sigma_\nu + \mathbf{1} \mathbf{d}^\top + \mathbf{d} \mathbf{1}^\top\)と表現される。
 [えーっと、よくわかんないけど、最後の刺激の効用の集団レベル平均を0に固定し、刺激(1,2)ペアの誤差分散を1に固定しなさい、そうするればあとは\(\Sigma_\nu \equiv \Sigma_\nu + \mathbf{1} \mathbf{d}^\top + \mathbf{d} \mathbf{1}^\top\)という問題だけが残る、ということでしょうか]

 多項プロビットモデルにおける等価な共分散構造という文脈で、Bekker & Wansbeek (2000) は以下を示している。\(\mathbf{\Sigma}_v > 0\)として、\(\mathbf{\Sigma}_v + \mathbf{1} \mathbf{d}^\top + \mathbf{d} \mathbf{1}^\top > 0\)を満たす\(\mathbf{d}\)の集合は $$ \mathbf{d} = \frac{\mathbf{1} + \mathbf{z}}{1- \mathbf{1}^\top \mathbf{V} \mathbf{z}} $$ ただし $$ \mathbf{V} = (\mathbf{\Sigma}_{v} + \mathbf{1} \mathbf{1}^\top)^{-1} $$ であり、\(\mathbf{z}\)は楕円 $$ \mathbf{z}^\top(\mathbf{V} + \mathbf{V} \mathbf{1} \mathbf{1}^\top \mathbf{V}) \mathbf{z} < 1 + \frac{1}{\mathbf{1}^\top \mathbf{V} \mathbf{1}} $$ の中に位置する。[虚心に写経したらなにかしら洞察がもたらされるかと思ったんだけど、だめだった]
 この結果は、Thurstonian 一対比較モデルにおいても、共分散行列が等価となる\(\mathbf{d}\)の集合を定義している。

 ここからは、具体的な共分散構造について検討しよう。

4.1 無制約な共分散構造
 Densie(1986)は次の識別制約を提案している。すべての項目について、効用の分散を1に固定する。さらに、ある特定の項目ペアについて、効用の共分散を0に固定する。
 この制約の性質について考えよう。すべての \(\mathbf{\Sigma}_\nu\)について、\( r_{kk} = 1, 1 \leq k \leq r\)であり \(\mathbf{\Sigma}_\nu = \mathbf{R}_\nu + \mathbf{1} \mathbf{d}^\top + \mathbf{d} \mathbf{1}^\top\) である\(\mathbf{R}_\nu\)が存在する。[…] つまりこのやり方は、\(\mathbf{\Sigma}_\nu\)の不定性に取り組む簡便な方法を提供しているように見える。実際、Maydeu-Olivares(2001 Psychometrika)もこの制約を採用している。
 しかし、\(\mathbf{R}_\nu\)を相関行列に制約してしまうと、等価な\(\mathbf{R}_\nu\)を持つような\(\mathbf{\Sigma}_\nu\)の集合はふたたび制約されてしまう。[…]

 Bockhenholt(2001 Psych.Methods)は、無制約な共分散構造として\(\Sigma_\nu\)ではなくて\(\Sigma_\kappa\)を計算することを勧めている。さらに、項目間の類似性関係を検討するため、\(\Sigma_\nu\)の分散の項が等しいと仮定して\(\Sigma_\nu\)を再構築することを勧めている(Bockenholt & Tsai, 2001 Brit.J.Math.Stat.Psych. もみよ)。こうした\(\Sigma_\nu\)はある加算定数についてのみ一意であることに注意[\(\mu\)の不定性は残っているってことかな]。しかし、異なる項目への判断がどのように共変動しているかを比べるためには便利な方法である。

4.2 制約的な共分散構造
[ThurstoneのCase V, Case II, それからもうひとつの共変量がはいった制約について述べている。パス]

5. 結論
[略]
—————–
 ううう… わからん… 読んでて余計に謎が増えた…
 この論文を読むにいたったきっかけは、一対比較回答に基づき項目の効用を推定するとき、識別のため効用の共分散行列(この論文でいう\(\Sigma_\nu\))に制約をかけるんだけど、その制約が効用の推定値の解釈に実質的なインパクトを持たないだろうか、という疑問があったからである。実際、自分の仕事の関連の一対比較回答データで、Maydeu-Olivares & Bockenholt(2005)が勧めているように「最初と最後の項目の効用の分散を1に固定し、最後の項目と他の項目の効用の共分散を0に固定する」という制約をかけると、最初と最後の項目の効用推定値の分散が他の項目と全然ちがうし、もちろん最後の項目と項目2, 3, …との間の共分散も全然違うのである。そりゃそうなんだけど、ちょっと困っちゃうんですよね。だって、個人レベルの効用推定値を層別集計したり、あとで個人の分類を試みたりするのが人情じゃないですか。その時、共分散構造が識別制約のせいで変な特徴を持っていては困る。
 4.1節では、いったん\(\Sigma_\nu\)を推定し、分散が等しいと仮定して再構築するという話が出てきたけれど、それなら最初から\(\Sigma_\nu\)の対角成分が等しいと仮定して分析してはあかんのか? うーん、なんだかあかんような気がするけど、なぜそう思うのかがよくわからない。

 2022/12/19: 原文に当たり直して少し追記した。
 2022/12/30: 系1の証明にチャレンジしたんだけど、途中で挫折した…
 2023/01/02: 原文にふたたび当たり直して少し追記。