« 読了:Russell&Petersen(2000) 複数カテゴリ購買の確率モデル・最終章 | メイン | 読了:「ミュジコフィリア」 »
2012年4月 3日 (火)
Johnston, B. & Schwartz, C. (1977) The analysis of an unbalanced paired comparison experiment by multiple regression. Journal of the Royal Statistical Society, Series C (Applied Statistics), 26(2), 136-142.
いわゆるシェッフェの一対比較法では,t 個の刺激から2つを取り出す t(t-1) 個のペアに対して被験者を割り当てるが,解説書の計算例では決まってきれいに均等割り当てされている。unbalancedな場合についての解説はないものかと,あれこれ探してみたものの,少なくとも日本語では全然見あたらなかった。実務場面では毎度そうそうきれいには割り付けられないだろうから,これはどう考えてもFAQだろうと思うのだが。私の探し方が悪いのかしらん。
仕方がないので,解説書の手順に頼らずに自力でどうにかしようと覚悟し,その練習のために読んだ。unbalancedだったり妙な欠損があったりする,やたらに複雑なデザインの一対比較課題を挙げ,重回帰でパラメータ推定してみせるという,チュートリアル的な論文。
記号が死ぬほどまどろっこしく,嫌々メモを取りながら読んだ。
対象者 k が刺激 i を r番目 (r={1,2}) にみたときの評価を
X_{irk} = \mu + \tau_i + \phi_r + \alpha_{ir} + \psi_{irk}
とする。\tauは刺激の効果、\phiは提示順序の効果、\alphaは刺激と提示順序の交互作用,\psiは誤差。刺激 i と j の一対比較評価 Y_{ijk} は X_{i1k} - X{j2k} 、すなわち
Y_{ijk} = (\tau_i - \tau_j) + (\phi_1 - \phi_2) + (\alpha_{i1} - \alpha_{j2}) + (\psi_{i1k} - \psi_{j2k})
である。\phi_1 - \phi_2を \phi, \alpha_{i1} - \alpha_{j2}を (\tau\phi)_{ij},\psi_{i1k} - \psi_{j2k}を \psi_{k(ij)}と書く (あああ...キタナイ...)。さらに刺激の組み合わせの効果 \gamma_{ij}を追加する。結局
Y_{ijk} = \phi + (\tau_i - \tau_j) + \gamma_{ij} + (\tau\phi)_{ij} + \psi_{k(ij)} (ただし i \neq j )
である。この式に以下の制約がかかる。
- \sum tau_i = 0。
- \sum_i \gamma_{ij} = 0。
- \gamma_{ij} = - \gamma_{ji}。組み合わせの効果だから。
- (\tau\phi)_{ij} = (\tau\phi)_{ji}。順序効果だから。
さて,深呼吸して,式の右辺をダミー変数W_0, W_1, ...の線形和に書き下す。刺激数が3の場合,
- \phi は \phi W_0 と書き換える。W_0は常に1。
- (\tau_i - \tau_j) は \tau_1 W_1 + \tau_2 W_2 + \tau_3 W_3 と書き換えることができる。ここでW_1, W_2, W_3は{-1, 0, 1}の3値をとるダミー変数で,たとえば刺激(1,2)の比較の場合はW_1 = 1, W_2 = -1 となる。制約1より,\tau_3 = -(\tau_1+\tau_2) だから,これは\tau_1 (W_1-W_3) + \tau_2 (W_1 - W_3) とも書ける。結局,W_1-W_3と,W_1-W_3という2つのダミー変数を考えればいいわけだ。これをW'_1, W'_2 とする。
- \gamma_{ij} は \gamma_{12} W_4 + \gamma_{21} W_5 + ... + \gamma_{32} W9。制約2と3を合わせると,\gamma_{12}さえ決まっちゃえば,\gamma_{21} = -\gamma_{12}, \gamma_{13} = -\gamma_{12}という風に,残り全部が決まってしまう。結局,\gamma_{12} (W_4 - W_5 - W_6 + W_7 + W_8 - W_9) となり,ある1つのダミー変数だけについて考えればよいことになる。これを W'_3とする。
- (\tau\phi)_{ij} は (\tau\phi)_{12} W_{10} + ... + (\tau\phi)_{32} W_{15}。めんどくさいから省略するが,結局 W_{10}+W_{11}-W_{12}-W_{13} と -W_{12}-W_{13}+W_{14}+W_{15} という2つのダミー変数について考えればよいことになる。これをW'_4, W'_5とする。
というわけで,このモデルは結局のところW'_1, W'_2, ..., W'_5 という5つの謎のダミー変数の重回帰として推定できるわけだ。こうすれば,unbalancedな場合でも容易に推定できる。
そのほか,データに構造的欠損があった場合はどうするか (交絡しちゃった交互作用項を外しなさい),被験者内要因や被験者間要因を追加するにはどうするか(ややこしくなるけど頑張りなさい),といった例が紹介されている。根気が尽きて飛ばし読み..
なんで1977年に書かれたあまり有名でない論文なんぞをネチョネチョと読んでいるのかと,どんよりした気分になってきたのだが,ま,ダミー変数の作り方がわかったのでよしとしよう。
それにしても,以前から疑問に思っていることがあって... 官能検査関係の本を読んでいると,シェッフェの一対比較法と並んで,芳賀の変法とか浦の変法とか中屋の変法といったアレンジが載っている。あれ,別に国際的に有名な手法というわけではないと思うが,どうなんだろう。諸外国ではどういう方法を使っているのだろうか。日本国内で日本ローカルな手法が広く使われているというのは,そのこと自体を悪いといってはいけないのだろうけど(数量化理論が好きな人とかが怒り出しそうだし),なにか取り残されているのではないかしらんと,ちょっと不安になる事態ではある。
論文:データ解析(-2014) - 読了:Johnston & Schwartz (1977) 不釣り合い型な一対比較実験データを重回帰で分析してみせよう