読了:Orben & Lakens (2020) あらゆる変数があらゆる変数と相関している。それがなぜ生じてどのくらいのインパクトがあるのか、もっと真剣に考えよう

たまたま読んだ奴。

Orben, A., Lakens, D. (2020) Crud (Re)Defined. Advances in Methods and Practirces in Psychological Science, 1-10.

 メモを取らずに通読し、あとで思い出しながら書いているので、いつにも増して不正確なメモだが…

 かつてMeehlはcrud factorという言葉を用いた。心理学の世界ではあらゆるものがあらゆるものと相関しているよねという話である[←MeehlってのはPaul Meehlね。私にはCronbach & Meehlのミール?という程度の知識しか無いが、とにかく心理学のビッグネームだと思う]。別の研究者はアンビエント・ノイズという言い方をしている。
 この概念、最近では心理学者たちが好き勝手に使うので始末に悪い。たとえば、この変数とこの変数の相関は統計的に有意だけどこれはcrud factorだろうから無視します、的な。
 crud factorはもともときちんと定義されてない概念なんだけど、Meehlが考えていたのは、諸変数の背後にある未知の因果的ネットワークであった。つまりMeehlにいわせれば、共通手法分散(CMV)を取り除いてもなお残る相関を生んでいるのがcrud factorなわけだ。[←ここんところが一番面白かった]
 心理学の論文をシステマティックにレビューしてみたんだけど、やっぱしcrud factorという概念の使い方は人によってばらばらで、きちんと定義せずMeehlの台詞を引用して済ませている人や、なんだか怪しい説明をしている人が多かった。こういうことではいかん。もっと真剣に定義し、実証的に検討しましょう…

 … というような内容ではなかったかと思う。
 実のところ、都合で少し時間を潰す羽目になったときにカバンにコピーが入っていたから読んだだけなんだけど、これがなかなか面白かった。
 正直にいうと、不勉強にしてcrud factorという言葉さえ初耳だったのだが、いわんとしていることはわかる。と同時に、そういう相関あるある、なんとなくわかるねえ、というのがよろしくないというのもよくわかる。

 ある仮説を調査データから検証したいんだけど、どの二変数をみても一定のレベルの相関があるので、どの程度の相関があれば仮説を支持する証拠になるのかよくわからない…という事態は、心理学に限ったことではないだろうし、私の日頃の仕事の中でも始終起きている。そういうとき、ついついあいまいな経験則に頼りたくなるわけだけど(相関が0.30ってのはたいした大きさじゃないですよ、的な)、当該領域において任意の二変数は一般にどの程度の相関を持つものなのか、冷静に腑分けして考えるべきだというのは、確かにその通りだ。その際には、測定に由来する相関(CMV)と、未知の因果的ネットワークに由来する相関は、なるほど、区別すべきだろう。ある研究分野におけるCMVの標準的なサイズを推定した研究はあるけれど、後者についても定量化ができたら、それはありがたいっすね。