北條大樹、岡田謙介(2018) 係留ビネット法による反応スタイルの分類:ヨーロッパの大規模健康調査を例に. 行動計量学, 45(1), 13-25.
anchoring vignetteについての論文。以前ざっと目を通したんだけど、今回仕事の都合で再読。
[評定項目に対する反応スタイル、特にERS, MRS, ARS, DRSの説明があって…]
従来の研究の多くは回答者の反応スタイルへの分類を行ってたんだけど、(1)自己評定に基づく分類には限界があるし(2)量的な測定が必要。
そこで出てきたのがKing et al.(2004 Am.Pol.Sci.Rev.)の係留ビネット法。自己評定のほかに、仮想人物についてのビネットを読ませてその人について評定させる、というのを何人かについてやる。で、反応一貫性(自己評定への回答とビネット項目への回答が個人内で一貫している)、ビネット等価性(回答者の誰もがビネット項目を同様に解釈する)という仮定の下で分析する。詳しくはKing先生のwebページを見よ。
どうやって分析するか。多くの研究はcompound hierarchical ordered probitやKing & Wand(2007)のノンパラ法で分析していた。
本研究ではBolt et al.(2014 Psych.Method)のベイジアンMIRTで分析するぞ。
回答者\(r\)が項目\(i\)に対して\(k\)番目の評定カテゴリを選択する確率を$$ P(U_{ri} = k | \theta_r, \mathbf{s}_r) = \frac{\exp(a_{ik} \theta_r + s_{rk} + c_{ik})}{\sum_h^K \exp (a_{ik} \theta_r + s_{rh} + c_{ih})} $$ とする。\(\theta_r\)は回答者特性。\(\mathbf{a}_i = \{a_{ik} \}\)は、たとえば5件法なら、自己評定では\(-2, -1, 0, 1, 2\)に固定しビネット項目では\(0, 0, 0, 0, 0\)に固定する。
\(\mathbf{s}_r = \{ s_{rk} \}\)というのがややこしいんだけど、\(s_{rk}\)が正の値であることは、カテゴリ\(k\)に回答しやすいということを意味する。\(\sum_k s_{rk} = 0\)と制約する。[ううう… まあいいや、ここの話はあとで]
\(\mathbf{c}_i = \{ c_{ik} \}\)は項目切片。\(\sum_k c_{ik} = 0\)とする。[ここのパラメータ化も、正直ちょっとやりすぎ感があるなあ。\(c_i\)でよくない? まあ推定できるってんならいいけどさ]
ここからが本研究。
欧州の大規模縦断調査SHARE Wave 1のデータを分析する。注目する尺度は、mobility, cognition, breathing [たとえばmobilityの自己評定というのは、「過去30日間にmoving aroundするときどの程度問題を感じましたか」に対するNoneからExtremeまでの5件法評定]。各項目についてビネット項目を3項目聴取している[例. Robは200mまでなら問題なく歩けるけど1km歩くと疲れる。買い物などの日常生活には問題ない。さあRobはNoneからExtremeのどれ?]
尺度の添字を\(w\)とする。モデルは$$ P(U_{rwi} = k | \theta_{rw}, \mathbf{s}_{rw}) \propto \exp(a_{ik} \theta_{rw} + s_{rwk} + c_{iwk})$$となる[めんどくさいので分母は省略した]。このモデルを反応スタイル統制モデル、ここから\(\mathbf{s}_{rw}\)を取っ払ったモデルを非統制モデルと呼ぶ。
事前分布は、\(\theta_{rw}\)と\(\mathbf{s}_{rw}\)と縦に積んだのを\(\theta’_{rw}\)として$$ \theta’_{rw} \sim MVN(\mu_w, \Sigma_w)$$ $$ \mu_w \sim MVN(\mathbf{0}, \mathbf{I})$$ $$ \Sigma_w \sim Wishart^{-1}(41\mathbf{I}, 40) $$ $$ c_{iwk} \sim N(0, 5) \ \ \mathrm{for \ \ k=1,\ldots,K-1}$$ とする。[細かいことだけど、たぶん\(\theta’_{rw}\)から最後の要素\(s_{rwK}\)を削ったのをMVNからドローして\(s_{rwK} = – \sum_k^{K-1} s_{rwk}\)としたんだと思う]
RStanで推定しました。
結果。
WAICならびにPSIS-LOO[←なにそれ]を求めたところ、統制モデルのほうがよかった。
個人別にみると、従来代表的といわれてきたERS, MRS, ARS, DRSのいずれとも違う反応スタイルが推定された人も出てきた。[←なるほど]
DIANAという手法でクラスタリングしたところ[Rのcluster::diana()のことだと思うけど、lazy.clusterというパッケージを使用しておられる]、やはり、絵にかいたようなERSとかは出てこなかった。
今後の課題: 反応スタイルの生成メカニズムの検討、潜在クラスモデルを拡張して分類する、小標本のときの頑健性、など。
————-
感想。
勤務先の若い人にこのモデルを実装してもらった時、\(\mathbf{s}_r\)というパラメータにもっとも奇妙な印象を受けた。反応スタイルをモデル化しようという試みは山ほどあるけど、その多くはもうちょっと制約的な表現をしていると思う。たしかAllenby兄貴は順序反応モデルの閾値を動かしていた。いっぽうこのモデルでは、個々の評定カテゴリに個々のマージンを乗せるわけだ。どんな反応スタイルでもどんとこいというための工夫だろうけど、そこまで自由にするこたないような気がしたのである。たとえば両極7件法だとして、両端に回答しやすい人とか中央に回答しやすい人とかはいそうだけど、評定カテゴリ1と4に回答しやすい人、ってのはあんまりいなさそうじゃないですか。項目形式ごとのそういう経験的知見をありがたくモデルに組み込んだほうがよくない? と思った次第である。
この論文をちゃんと再読してみると、事前に反応スタイルの伝統的カテゴリを仮定せず、ボトムアップにカテゴリ化するところが売りなので、なるほど失礼しました、と思った。いっぽう、自分の仕事に当てはめて考えてみると、いま手元のデータに対し、このモデルのように反応スタイルについての仮定を極力おかないモデルを推定した結果、「両極7件法評定のカテゴリ1と7に回答しやすい人」とか「3に回答しやすい人」とかが出てきたんならいいけど、「1と4に回答しやすい人」とかが出てきちゃったら、ざわっ… とすると思いますね。これあってんの? むしろ少数の項目回答からからムリクリ推定したせいで出てきたアーティファクトじゃない? と思うだろう。
こうしてみると、手元の調査データから反応スタイルをpartial outしたいというような場面では、あらかじめよく使う項目形式についてメジャーな反応スタイルのタイポロジーを作っておいて(ないし、反応スタイルについての先行研究で提案されてきたタイポロジー、たとえばBaumgartner & Steenkamp(2001)が挙げている7タイプを信じ)、それらのタイプだけを表現するようなより制約的なモデルを当てはめたほうが頑健なんじゃないかという気がする次第である。そういうタイポロジーを構築するための研究において本論文で使われているようなモデルを使うっていうんなら、それは素晴らしいことだと思うけど(この論文の主旨はそっちなんでしょうね)。