« 読了:「李鴻章」 | メイン | 読了:Garland(1991) 5件法評定と4件法評定のどっちがいいか »
2012年1月 6日 (金)
Carifio, J. & Perla, R. (2008) Resolving the 50-year debate around using and misusing Likert scales. Medical Education, 42. 1150-1152.
たった2頁のコメンタリー。なぜか忘れたが国会図書館でコピーしていた(きっとタイトルがすごく魅力的だったからだろう)。リッカート尺度についてちょっと考える用事があったので、ついでに目を通した。
リッカート尺度(いわゆるx件法評定ですね)で得たデータは「順序尺度だからノンパラメトリックな統計量で分析しなければいけない」という立場と、「いや複数項目を合成するんであれば間隔尺度とみなすことができて、だからパラメトリックな統計量で分析してよい」(平均とかSDとかですね)という立場とがあって、このMedical Educationという雑誌で論争があったりしたんだそうだ。へえー。
で、著者いわく... F検定は順序尺度データに対して頑健だということがシミュレーション研究でわかっている。また、まあ8項目くらいあればその合成得点は間隔尺度の性質を持つということが経験的に知られている。つまり上記の論争については後者に軍配があがる。むしろ問題は、前者の立場がどこから生まれてきたかだ。これはもともStevensの、項目が順序尺度なら合成得点も順序尺度だという論理的な議論に基づいている。でも分子が原子と違う性質を持つのは医学者なら誰でも知っているでしょう。論理的議論よりも経験的議論のほうを重視すべきだ。云々。
うーん... なんだか話がずれているような気がする。俺の怪しい理解によれば、Likert scaleという言葉はちょっとあいまいに使われていて、伝統的な態度尺度構成法のひとつであるところの、x件法評定項目を使ったmethod of summated ratingsを指す場合と、転じてx件法評定項目そのもののことを指す場合があるように思う。著者が誤った見解として引き合いに出しているJamieson(2004)をザーッとナナメ読みしたのだけれど、Jamiesonさんが考えているのは後者のこと(したがって基本的には単一項目の分析のこと)、いっぽう著者がいっているのは前者のこと(したがって合成得点の分析のこと)じゃないのかという気がする。論争の途中経過を読んでいないので、なんともいえないが。
もうひとつ気になったのは、単一項目の分析について著者が Analysing a single Likert item [...] is a practice that should only occur very rarely とあっさり切り捨てていることで、医学研究ではほんとにそうなんですか? という疑問がある。たとえば特定の疾患のQOL評価では、複数項目を聴取するもののキーになるのはたった1項目、ということがあると思うけど、ああいうのはvery rareなのか。まあ、よく知らないけど、少なくとも質問紙調査全体に一般化できる主張ではないですね。。
論文:データ解析(-2014) - 読了:Carifio & Perla (2008) X件法尺度についての論争に決着をつけてみせよう