« 読了:「宇宙怪人しまりす 医療統計を学ぶ 検定の巻」 | メイン | 読了:「デリバリーシンデレラ」 »
2012年8月18日 (土)
Kahneman, D., & Frederick, S. (2005) A model of heuristic judgement. Holyoak, K. J. & Morrison, R.G. (eds.) "The Cambridge Handbook of Thinking and Reasoning," Chapter 12. Cambridge University Press.
70年代初頭のTversky&Kahnemanにはじまる、ヒューリスティックスとバイアスの研究を振り返り、著者らの最新の道具立て(2システム・モデル)によって整理する内容。有名な代表性ヒューリスティクスや利用可能性ヒューリスティクスは、ここでは属性代用 (attribute substitution) のプロセスとして説明される。
いくつかメモ:
- 著者らいわく(2節)、属性代用を示す直接的証拠は、規範解からの逸脱(バイアス)ではなく、「ヒューリスティック誘発」デザインによる証拠である。なにを云うておられるのかというと...
たとえば有名なリンダ問題(連言錯誤課題)の場合、次のようなデザインがそれである。被験者に説明文を読ませたのち(「リンダは31歳の独身女性で哲学専攻で反核運動やってて...」)、ある群には8つの文の確率を順位づけさせ、別の群には同じ8つの文の代表性を順位づけさせる。8つの文のうち6つはフィラー、残り2つがかの有名な「彼女は銀行員だ」と「彼女は銀行員で女性運動家だ」である。よく知られているように、後者のほうが確率評定が高くなっちゃうのだが(連言錯誤)、属性代用の直接的証拠は、各群における8文の順位の平均が群間でばっちり相関することだ、とのこと。 - 上の話は確率評定群と代表性評定群の集計値を比べているわけで、そんなんが直接的証拠なんですか、むしろ確率評定と代表性評定の個人内の関連性を調べたほうがよろしいんとちがいますか... と思うところだが、著者らに言わせればそれはアサハカな考え方である(3節後半)。
いわく、ことヒューリスティクス研究に関する限り、被験者内デザインはよろしくない。なぜならば、被験者はなにを操作されてるか気が付いちゃうし、どうしても課題が型にはまったものになっちゃうし、判断は操作変数のきれいな線形結合になりがちだから(Andersonの情報統合理論を見ろよ、とのこと)。要するに、被験者内デザインは生態学的妥当性が低い、という御批判である。手厳しいなあ。 - 上の実験の確率評定群では、「彼女は銀行員だ」と「彼女は銀行員で女性運動家だ」の両方がリストに入っているが、あいだにフィラー文が入っており、2つの文を比較するようには教示していない。こういう風に、エラー回避に十分な情報が与えているがその情報に注意を喚起していないタイプの実験のことを、Tversky&Kahneman(1983, Psych. Rev.)は"subtle"と呼んでいるのだそうだ(3節前半)。今風にいうと、システム2のために十分な情報は並べるが、寝てるところを起こしはしない、といったところ。
さて著者らいわく、いまにして思えば、連言錯誤やベースレート無視の論文ではsubtleな課題に話をとどめておけば混乱がなかったかも、とのこと。実際には著者らは、たとえばリンダ問題では本命の2文を直接比較させてもなお頑健なエラーが生じることを示してきたのだが(そして先生、そこが面白かったんですが)、実のところあれは自分たちの中心的な主張じゃなかった由。著者らが言いたかったのは、直観的判断が(いまの言葉でいえば)システム1でなされ、そこから連言錯誤やベースレート無視がもたらされるということであり、システム2がそれを修正する可能性は認めていた。だから、仮に2文の直接比較において連言錯誤が消失しても、自分たちの主張は変わらなかった、とのこと。ふうん。 - 連言錯誤やベースレート無視の実験はさまざまな批判を巻き起こした。被験者は教示があいまいだからエラーを起こしたんだとか、慣習的規範のせいでエラーを起こしたんだとか(著者らはここでHiltonの語用論的批判を例に挙げている)。
著者らいわく、この批判について考えるためには、人間の合理性をcoherence rationalityとreasoning rationalityとに分けて考える必要がある(3節前半)。前者は信念・選好の体系の内部的整合性のことで、リンダ問題のsubtleな実験は、人にこの意味での合理性が欠けていることを示している。いっぽう後者は、手元の情報に照らしてとにかく正しい推論ができることを指す。リンダ問題の実験はこの意味での合理性の否定であると解され批判された。それらの批判には当たっているところもあったが、「どの批判もある重要な弱点を抱えていた。連言ルールについての直接的テストにおいて観察された判断は、他の3つのタイプの実験において観察された判断と完全に整合していたのに、彼らはその理由を説明できなかったのである。3つのタイプの実験とは、subtleな比較、被験者間の比較、そしてこれが一番大事なのだが、代表性判断である。連言錯誤がアーティファクトだと抜かしたアホどもは、確率評定と代表性評定がばっちり相関するというワシらの結果を無視しよったのじゃ」(途中から意訳) - 話変わって...
- カテゴリ的予測ではベースレートが無視されがちである。「ここに法律家が30人、エンジニアが70人います。そのなかのある人は、魅力的で賢くて話し上手で皮肉屋です。この人が法律家である確率は?」 30人というところが無視されがち。
- 過去の出来事の要約的評価では,持続時間が無視されがちである。「お隣のうちの車のアラームが30分間鳴りつづけたら、どのくらい嫌ですか?」 30分と言うところが無視されがち。
- 公共財の経済的評価では,スコープが無視されがちである。「20万羽の渡り鳥が油田に落ちて死ぬのを防ぐためにあなたが払える金額は?」 20万羽というところが無視されがち。
問題の人物が法律家である確率、鳴りつづけるアラームを聞くことの嫌さ加減、渡り鳥を救う金額的価値といった属性はextentionalであり、その判断は規範的には加算的に決まる(単純な足し算ではないにせよ)。たとえば渡り鳥を救うことの金額的価値は、救える鳥が1000羽増えれば増大するはずである(どのくらい増大するかは別にして)。ところが実際には、人は(1)カテゴリをプロトタイプ事例で代用し、(2)カテゴリのextentionalなターゲット属性を、プロトタイプ事例のnonextensionalなヒューリスティック属性によって評価する。だから、法律家の割合や、アラームの持続時間や、救われる鳥の頭数は無視されるのである(システム2が起動したら修正されるけど)。それぞれのエラーについて他のタイプの説明はあるけれど(順に,Cosmidesら、Arielyら、Kopp(1992, J. Policy Anal. & Mgmt.)というのが挙げられている)、このように統一的に説明できているのは我々だけだ、とのこと。 - 本筋とは違うけれど... Bodenhausen(1990,Psycho.Sci) という人が判断とサーカディアン・リズム(日内変動)の研究をしていて、朝型の人は夜のほうが、夜型の人は朝のほうが、連言錯誤を起こしやすいことを示しているのだそうだ。へええ。
この論文は、ちょっといきさつがあって以前著者にご恵送いただいたのだが(ありがとうございました...)、そのときはどうしても読めなかった。このたび仕事の都合で淡々と目を通したのだけれど、自分が心理学の理論論文を再び読もうと思うことがあるとは全く思わなかったし、こうして穏やかに読めるようになる日が来るとも思わなかった。ずいぶん節操のないことだとも思うし、時間とともに変わらないものなどなにもないのだなあ、という感慨もある。
論文:心理 - 読了:Kahneman & Frederick (2005) ヒューリスティック的判断のモデル