読了: Preston & Colman (2000) X件法評定尺度のXはなにがよいか実験 in 2000

Preston, C.C., Colman,A.M. (2000) Optimal number of response catgories in rating scales: Reliability, validity, discriminating power, and respondent preferences. Acta Psychologica, 104, 1-15.

 仕事の都合でざっと目を通した。「X件法評定尺度のXはどうするのがよいか」実験。あまりに枯れたトピックなので、00年代の論文は珍しい。

 先行研究は別のメモにまとめたので省略して…

 対象者は学生など。調査票を配る。行ったことのある店舗ないしレストランのサービスの品質を訊くもので、まず101件法で総合的な品質を訊く(これを基準関連妥当性を調べる際の基準として用いる)。
 で、11個の設問群を(ランダム順で)提示。各群は評定項目5個からなり、たとえばレストランだったら「スタッフの能力」「サービスの早さ」「選択の幅」「清潔さ」「個人的注意」。11群の中身は同じ、各項目の回答カテゴリの両端がvery poorとvery goodである点も同じで、回答カテゴリ数だけが異なる(2,3,4,5,6,7,8,9,10,11,101)。101件の場合は100満点で得点を書かせ、他の場合は該当するカテゴリにマルをつけさせる。5項目回答するごとに、答えやすかったか、速く答えられたか、自分の気持ちを適切に答えられたか、の3つを評定させる(101件法)。
 初回調査の1週間後にもう一度同じ調査票を配って回答させた。129名の回答を分析する。

 結果。
 まず、回答カテゴリ数が違っていても測定対象は同じだよというチェックをやって… [11条件別に因子分析したりして。メモ省略]
 信頼性について。回答カテゴリ数別に、再検査信頼性と内的整合性(5項目間のα)を調べる。いずれも0.79以上。再検査信頼性は7-10件法あたりが高い(といっても僅差だけど)。αも件数を増やしたほうが高いが、7件法あたりから上がらなくなる。
 妥当性について。次の3つを調べる。(1)基準関連妥当性。対象者別に5項目を合計し、全体品質との相関をとる。(2)弁別力。全体品質で対象者を3群に分けておき[…ちょっとなにいってんだかわかんなかったのでパス。難しい話ではないのでゆっくり読めばいいんだけど…]。(3)収束的妥当性。[なんかちまちました話で面倒くさくなってきちゃった…パス]
 対象者の選好について。[…パス…]

 考察。
 再検査信頼性は2-4件法で低く7-10件法で高かった。内的整合性は2-3件法で低く7件法以上で高かった。
 基準関連妥当性は2-4件法で低かった。弁別力は2-4件法で低く9件法と101件法で高かった。収束的妥当性は2-3件法で低かった。
 対象者に好まれたのは7-10件法であった。細かいことをいえば、速く答えられると評価されたのはもっと件数が少ないとき、気持ちを正しく表現できると評価されたのはもっと件数が多いときなので、たとえばtime-pressure下で調査する際には3-5件法がよかったり、face validityが大事なときは10件法がよかったりするかも。
 本研究では実生活の経験について訊いた。先行研究で結果が一致しないのは、訊いている内容が違うからではないか。
 云々。

 結果のところをちゃんと読んでないのになんですが、さすがにActa Psychologica、きちんとした論文であった。まあ内容はちょっとしょぼいけど。100人ちょいの対象者に同じ5項目を11回も繰り返し訊いた実験調査の結果からあれこれ語られてもなあ、っていう気もするけど。(すいませんすいません)