イエスマンたちの本音～評定データにおける回答スタイルの補正～

おばちゃんたちが世間話をしていました。共通の知人であるナントカさんについての噂話です。「あの人ちょっとねー，自分の意見を無理やり通すところあるでしょう？」「そうそう。私もそう思ってたのよー」「でもあの人，まわりの意見に流されちゃうこと多いのよー」「そうそう，そういうところあるわよねー」...どっちなんだ！

調査対象者に「人生において最も大事なのはお金だ」という文を示し，同意できる程度を聴取しました。その結果，「非常に同意できる」にマルをつけた人の割合は日本人よりもアメリカ人で大きい，という結果が得られました。さて，この結果は，アメリカ人のほうが拝金主義的だということをあらわしているのでしょうか？それとも，アメリカ人はどんな質問文に対しても「非常に同意できる」と答えやすいイエスマンたちだ，ということに過ぎないのでしょうか？...これが「回答スタイル」の問題です。オランダ・エラスムス大学のファン・ロスマーレンたちは，評定データにおける回答スタイルの影響を統計的に取り除き，対象者の態度だけを取り出す手法を提案しています。

消費者調査ではX件法評定尺度を用いた項目がよく使われます。しかし，評定項目に対する回答は，その人の態度を反映しているだけでなく，その人の回答スタイルをも反映している可能性があります。たとえばChen, Lee & Stevenson(2006)は，日本と台湾の調査対象者に比べて北米の対象者は7件法評定尺度に対して両端方向に回答しやすい傾向があることを指摘しています。こうした回答スタイルの個人差は，調査結果を解釈するときの大きな妨げになります。

対象者の回答スタイルを同定しその影響を取り除く，という取り組みは古くからなされています。この研究はその新手法を提案するものです。著者らの「潜在クラス双一次多項ロジットモデル」(LC-BLMモデル)は，ある対象者がある項目である段階にマルをつける確率が，(1)それがどの回答カテゴリか，(2)その対象者はその項目内容にどんな態度を持っているか，(3)その対象者はどんな回答スタイルを持っているか，の和で決まると想定します(多項ロジットモデル)。また，態度に対する対象者特性の影響と回答カテゴリの特徴を少数の次元上で表現できると想定します(双一次分解)。その上で，対象者の態度の個人差と回答スタイルの個人差はそれぞれ少数個のパターンで表現できると想定します(潜在クラスモデル)。

このLC-BLMモデルを，多様な項目に対する回答データに適用すると，それぞれの回答者に対して「もしその人が特定の回答スタイルを持っていなかったら，各項目に対してどんな回答をしたはずか」を推測することができます。つまり，回答スタイルを補正した回答データを手に入れることができます。

ファン・ロスマーレンたちはこのモデルを，欧州5カ国の人々を対象にした人生の価値観についての9項目の調査結果に適用しました。その結果，高年齢の人，教育レベルの低い人，(英・独と比べて)仏・伊・スペインの人は，9件法評定に対して両端方向に回答しやすい，という知見が得られました。

さらに彼らはこのモデルを用い，回答スタイルを補正した回答データを算出しました。LC-BLMモデルによる補正データは，オリジナルの回答データや先行研究で提案されていた手法による補正データと比べ，実際の消費行動と高い相関を示しました。彼らはこの結果を元に，LC-BLMモデルによる補正は従来の方法に比べて妥当性が高い，と主張しています。

今回は調査データの分析手法についての研究をご紹介します。この論文は第一著者の博士論文の一部であるようです。

評定項目に対する回答スタイルの問題は，特に多国間調査の文脈で大きな問題になると思います。市場調査の現場では，「日本人って真ん中につけやすいよね」といった経験的知見がそれぞれに蓄積されていると思いますが，定量的な証拠に基づく議論は少ないように感じます。その理由としては，

回答スタイルの差異を捉えるためには多様な項目に対する大きなデータセットが必要である
回答スタイルの影響があることがわかったところで，個々の調査データにおいて影響の大きさを定量化したり，回答を補正したりするのは難しい

という2点が挙げられると思います。この論文は後者の問題に対して貢献するものです。

消費者調査データの分析手法として興味深い提案だと思いました。対象者や項目の特性を視覚的に表示する方法を併せて提案しているところが魅力的です。残念ながら図表は引用できませんが，本論文の基になったプレプリントに本論文とほぼ同じ図表が掲載されています。p.16のFigure 2.に対象者特性の視覚的表示が示されています。

個人的には，(彼らが用いているLOVのように)少数の回答セグメントが存在していることがすでに知られている場合を別にすると，一般には潜在クラスモデルが想定する局所独立性仮定が維持されるという保証がないので，階層ベイズモデルを用いた補正(Rossi, Giluta &Allenby, 2001)のほうが汎用性があるのではないか... という疑問を感じましたが，私の能力を超える疑問なので，専門家にお任せせざるを得ません。ともあれ，この種の新手法はソフトウェア開発を伴わないと普及しないので，著者だか誰だかがソフトウェア・パッケージを作ってくれるのを待ちたいと思います。問い合わせたところ，著者らのチームはいまMATLABで書いたプログラムの公開を準備しているそうです。

ところで，この研究が用いているLOV調査では，人生についての9つの異なる価値が項目として提示されています(「興奮を求める」「暖かい人間関係を求める」「尊敬を得ることを求める」...)。この9項目がお互いに異なるものであったからこそ，ある人がすべての項目について「とても重要だ」と回答したとき，その人は何に対しても「とても重要だ」と答えてしまうタイプの人だろうと推定できたわけです。もしこの調査の項目がどれも似たような価値であったらどうでしょうか(「興奮を求める」「スリルを求める」「サスペンスを求める」...）。この場合，ある人がすべての項目について「とても重要だ」と回答したとき，それは回答スタイルを表しているのか，それともその人の価値観を正しく表しているのか，区別がつきません。

このように，項目内容への態度と回答スタイルとを切り離すためには，項目群に多様性があることが鍵になります。これは態度調査の設計における古典的なノウハウです。この論文で提案された新しい分析手法を用いたところで，このノウハウの重要性は変わらないように思います。言い換えれば，「いいかげんに集めた調査項目でもこの新手法ならどうにかしてくれる」わけでないことに注意する必要があると思います。

van Rosmalen, J., van Herk, H., Groenen, P.J.F. (2010) Identifying response styles: A latent-class bilinear multinomial logit model. Journal of Marketing Research, 47(1), 157-172.

要約

評定尺度に対する答え方は対象者によって大きく異なりうる。このような回答スタイルの多様性は，回答の妥当性を脅かす可能性がある。本論文の目的は，回答スタイルと項目内容が評定尺度への反応に与える影響について調べることである。回答スタイル・項目内容・回答者の背景的特性のさまざまなタイプを説明する新しいモデルを開発した。双一次多項ロジットモデルを用い，対象者特性が回答行動に与える影響と，項目内容の影響とを視覚的に区別することに成功した。このアプローチを有限混合モデリングと併用し，対象者の反応スタイルのセグメンテーションと，項目内容のセグメンテーションを行った。この潜在クラス双一次多項ロジットモデルを，有名な"List of Values"質問紙の複数国データに適用した。その結果，対象者の意見と回答スタイルにおける大きな差異が示され，これまで知られていなかった回答スタイルの存在が明らかになった。回答スタイルの中には，コミュニケーション･スタイルとして妥当だと思われるスタイルもあれば，項目間での不整合とともに生じることが多い，回答の歪みだと思われるようなスタイルもあった。

(イントロダクション)

調査票の項目に対して，その項目の内容とは無関係に，一定の傾向で回答してしまう場合がある。この傾向のことを回答スタイルという。回答スタイルは回答のバイアスだとみなされる場合もあれば，ある種のコミュニケーション・スタイルだとみなされる場合もある。いずれにせよ，回答スタイルは項目内容に対する回答の妥当性を脅かす可能性がある。

データから回答スタイルを除去する方法として，(1)イプサティブ・スコア(個人内での差異をあらわすスコア)に変換する，(2)個々の対象者内の平均値を統制変数として用いる，(3)多様な項目を含む大データセットで回答スタイルの指標を求めておき，回答を回帰で補正する，(4)モデルに回答スタイルのパラメータを入れる，などの手法が提案されている。しかし，どの手法をつかうべきかのコンセンサスがないし，そもそも補正しようとさえしない研究も多い。補正後の値の妥当性がはっきりしていないという問題もある。

本論文では，回答スタイルと，項目内容への態度が，回答行動に及ぼす効果に注目する。回答スタイルと態度の多様性をセグメンテーションによって捉える(事前に回答スタイルをタイプ分けしたりはしない)。さらに，回答行動に影響するであろう対象者の背景的特徴もモデルに取り入れる。

本研究は先行研究に対して2つの貢献をもたらす。

回答行動の規定要因への理解を深める。回答行動のモデルを構築し，項目内容の影響をバイプロットで視覚的に表示する。
評定尺度の段階を順序カテゴリとしてではなく名義的カテゴリとして捉える。欠損やDK回答を統一的に扱えるというメリットがある。

1. LC-BMLモデル

(※以下，数式はlatex記法で記述)

項目への反応を，項目と，対象者の背景を表す項目群とで表現するモデルを考える。すべての変数を名義尺度として扱う。多項ロジットモデルで定式化すれば，対象者 i (人数 n )が項目 t (項目数 T )の評定カテゴリ j (カテゴリ数 J )を選択する確率は

Pr(Y_{it}=j) = exp(z_{ijt}) / (分子のカテゴリ間合計)
z_{ijt} = a_j + \sum^K_{k=1}( \bm{ b_{jk}' x_{ik} } ) + c_{jt}

ただし，

a_j ... カテゴリ j の魅力度をあらわすパラメータ
\bm{x_{ik}} ... k 番目の背景項目を表すダミー変数ベクトル(ダミー変数の数をm_k個とする)
\bm{b_{jk}} ... k 番目の背景項目と評定カテゴリ j の関係を表すパラメータベクトル
c_{jt} ... 項目 t における評定カテゴリ j の選ばれやすさをあらわすパラメータ

このモデルのままだと，膨大な数のパラメータを推定する羽目になるし，得られたパラメータの解釈も難しい。

(※引用者注: ここでいう「多項ロジットモデル」とは，名義変数を従属変数とするロジスティック回帰モデルのこと。多項ロジット型選択モデルのことではない)

1.1 パラメータの双一次分解

パラメータを少数次元空間で図示するために双一次分解を用いる。以下の2つのパラメータ行列を考える。

\bm{B_k} = \bm{ [ b_{1k} | b_{2k} | ... | b_{Jk} ] ' }。縦ベクトル\bm{b_{jk}}を横に並べて転置した行列。サイズ(m_k, J)。
\bm{C}。c_{jt}を要素とする行列。サイズ(J, T)。

この2つの行列に次の制約をかける。

\bm{B_k} = \bm{ F G'_k } かつ \bm{C} = \bm{ F H' }

ただし，

\bm{G_k} ... k番目の背景変数の各カテゴリの座標行列。サイズ(m_k, P)。以下，p列目を\bm{ g_{kp} }とする。
\bm{F} ... 評定カテゴリの座標行列。サイズ(J, P)。以下，要素をj_{jp}とする。
\bm{H} ... 項目の座標行列。サイズ(T, P)。以下，要素をh_{tp}とする。
P は次元数。P=J-1のとき，制約をかけなかったのと同じになる。

この制約の下で，モデルの項を以下のように書き換えることができる

\bm{ b_{jk}' } = \sum^P_{p=1}( f_{jp} \bm{ g_{kp}'} )
c_{jt} = \sum^P_{p=1}( f_{jp} h_{tp} )

というわけで，モデルは下式となる。

Pr(Y_{it}=j) = exp(z_{ijt}) / (分子のカテゴリ間合計)
z_{ijt} = a_j + \sum^K_{k=1} \sum^P_{p=1} ( f_{jp} \bm{ g_{kp}'} x_{ik} } ) + \sum^P_{p=1}( f_{jp} h_{tp} )

1.2 対象者のセグメンテーション

このモデルに2つの潜在クラスを持ち込む。ひとつは回答スタイルをあらわす潜在クラスs(S個)，もうひとつは項目への意見を表す潜在クラスr(R個)である。さらに，2つのクラス･メンバーシップの事前確率が非独立だとみなす(独立だと想定してもよい)。

s かつ r に属する事前確率をu_{rs}とすると

Pr(Y_{it}=j) = \sum^R_{r=1} \sum^S_{s=1} u_{rs} Pr( Y_{it}=j|r,s)
Pr(Y_{it}=j| r,s) = exp(z_{ijt|r,s}) / (分子のカテゴリ間合計)

a_j が回答スタイルによって異なり，h_{tp} が項目への意見によって異なるから，

z_{ijt|r,s} = a_{j|r} + \sum^K_{k=1} \sum^P_{p=1} ( f_{jp} \bm{ g_{kp}'} x_{ik} } ) + \sum^P_{p=1}( f_{jp} h_{tp|s} )

ここからモデルの尤度関数がつくれる。いくつか技術的な制約をかけてやるとこのモデルは同定可能になる。パラメータが決まれば個人の各セグメントへの所属確率を求めることができる。次元数はモデルの適合度の比較で決められる。

1.3 回答スタイルの補正

a_{j|r}を0に固定して事後確率を推定しなおせば，オリジナルの回答データから，回答スタイルを取り除いた回答確率 Pr( Y_{it}=j | \bm{y_i} )を推定することができる。

2. 実証的適用: LOV

LC-BMLモデルを，有名なLOV(List of Values)調査に適用する。 LOVでは，多様な価値観(9項目)に対して9件法の重要度評定を求める。回答はいくつかのセグメントに分かれることが知られている。

5カ国(英独伊仏西)の男性のデータ(N=4916)を使用する。背景特性は，国(5水準)，年代(4水準)，教育レベル(2水準)。背景特性が欠損している対象者，LOVの全項目に対して同一の回答をしている対象者を排除し，N=4514について分析する。

3. 結果

BICにより，次元数 P = 2, 回答スタイルセグメント数 R=11, 項目セグメント数 S=5 を採用した。

評定カテゴリの座標行列\bm{F}をベクトル，背景変数の各水準の座標行列\bm{G_1, G_2,...}を点としてバイプロット表示した(Figure 1-2)。横軸が態度の強さ，縦軸が両端のカテゴリの選びやすさをあらわす図が得られた。高年齢・低教育・伊仏西が両端のカテゴリを選びやすいことが読み取れた。

3.1 項目セグメント

項目セグメント別に，評定カテゴリの座標行列\bm{F}をベクトル(これは全セグメントで共通)，項目の座標行列\bm{H} を点としてバイプロット表示した(Figure 3)。各セグメントの態度の違いを読み取れる図となり，セグメントに命名できた(「快楽主義」，「無関心」，...)。

3.2 項目セグメントと対象者特性

項目セグメントと対象者特性のクロス表を検討した。セグメント間に特性のちがいがみられた。

3.3 反応スタイルセグメント

11個のセグメントが得られた(「極端な回答」「中間の回答」「幅広い回答」...)。従来の研究で指摘されていた回答スタイルと整合的であった。ただし，以下の新しい知見が得られた:

9段階の「両端と中央を使いやすい」という回答スタイルセグメントが存在する。
回答に欠損が多いセグメントは，同意傾向が高い。

3.4 セグメント間の依存関係

一部の項目セグメントでは特定の回答スタイルセグメントが大きかった。例) 項目セグメントにおける「無関心」セグメントは，回答スタイル｢中間の回答」「幅広い回答」「極端な回答」「どちらでもないと回答」が多い。

3.5 結果の信頼性

点に信頼楕円を重ね描きすることもできる(Figure 4.)。

3.6 外部妥当化

回答スタイルの影響を除去した回答を推定した。また，他の4つの方法でも推定を得た。それぞれの方法について， 20個の医療製品の使用頻度との相関行列をつくった(9 x 20)。有意な相関係数の数はLC-BMLモデルで高かった。

4.結論と考察

回答行動理解への本研究の貢献:
- 対象者と項目の特性を視覚的に調べる方法を提案した。
- 回答スタイルのタイプについて事前の想定を置いていない。
- 評定データに順序を想定していない。欠損やDKも同様に扱っている。
マーケティングでの示唆
- ターゲティングの際に無視すべき対象者集団を同定できる(本研究における「無関心」「混乱」項目セグメント)。
本研究の項目セグメントを，マーケティングにおける効率的セグメンテーションの基準と照らし合わせると...
- 同定可能性，実質性... あり
- 安定性 ... 価値観だから，おそらく安定している
- アクセス容易性 ... 対象者特性によってセグメントの分布が異なるから，アクセス容易
- 反応性とアクション可能性 ... 本研究の例でははっきりしない。特定の製品への態度を用いると良いだろう
限界 ... 限られた項目についての検証だった; 計算に時間がかかる; ソフトがない; 他のデータセットでは他の回答スタイルセグメントが出現するかも
将来の方向 ... 新興市場のデータによる検証; DKや欠損の解釈のための使用; 欠損補完のための使用

イエスマンたちの本音～評定データにおける回答スタイルの補正～

カテゴリ:

タグ:

このブログ記事について

最近のブログ記事

さりげない宣伝

問答無用のおすすめ本

泣く子も黙るおもしろ本

カテゴリ

イエスマンたちの本音 ～評定データにおける回答スタイルの補正～

カテゴリ:

タグ:

このブログ記事について

最近のブログ記事

さりげない宣伝

問答無用のおすすめ本

泣く子も黙るおもしろ本

カテゴリ

アーカイブ

イエスマンたちの本音～評定データにおける回答スタイルの補正～