elsur.jpn.org >

« 読了:Bi (2001) double識別試験の統計学的諸側面 | メイン | 「弟の夫」「山賊ダイアリー」「かくしごと」「きのう何食べた?」「ふつつかなヨメですが」「プリンセスメゾン」「俺の姫靴を履いてくれ」 »

2016年10月20日 (木)

Morrison, D.G. (1981) Triangle Taste Tests: Are the Subjects Who Respond Correctly Lucky or Good? Journal of Marketing, 45(3), 111-119
 仕事と関連があるぞという気がして急遽目を通した。PDFが有料なので、JSTOR無料枠のweb画面上で。泣かせるね。

 官能評価でいうdouble triangle test、つまり、「3刺激を与え、そのなかの同一の2刺激がどれかを言い当てる」試行を2回やるテストで、個人の判別能力と正解数(0,1,2)との間にはどういう関係があるか、という論文。
 なぜそんな不思議なことに関心を向けるのかというと、著者らの説明によれば、(1)あとで選好テストをするときに対象者を重みづけしたいから、(2)反応時間と選好の関係を調べる際に示唆があるかもしれないから。

 triangle test試行において、ある対象者が正解を検出する確率を$p$としよう。正解を検出できないとき、にもかかわらずguessingで正解する確率は$1/3$。だから、ある対象者がある試行で正解する確率は
 $c = p + (1/3)(1-p)$

 さて、$p$の個人差について、2つの極端なモデルを考える。
 モデル1, 等質母集団。全員が同じ$p$を持っている。このとき、double triangle test で正解数が(0,1,2)になる確率は、それぞれ
 $P(0) = (1-c)^2$
 $P(1) = 2c(1-c)$
 $P(2) = c^2$
 モデル2、両極母集団。ある人が持っている$p$は0か1のどちらかであり、1である人の割合は$\gamma$である。このとき、
 $P(0) = (1-\gamma)(2/3)^2$
 $P(1) = (1-\gamma) 2(1/3)(2/3) = P(0)$
 $P(2) = \gamma + (1-\gamma)(1/3)^2$
 モデル2なら$P(0)=P(1)$だというのがポイント。モデル1の場合、2問正解者は単にラッキーな人だが、モデル2の場合は高能力者である。

 今度は連続的モデルを考えよう。$p$の分布$f(p)$を考える。$f(p)$としてベータ分布を仮定しよう。ご存知のように、
 $E[p] = \frac{\alpha}{\alpha+\beta}$
 $Var[p] = \frac{\alpha\beta}{(\alpha+\beta+1)(\alpha+\beta)^2}$
 この$f(c)$から得られる$c$の分布を$g(c)$とする。正解数の分布は、試行数$k=2$と正解率$g(c)$をパラメータとする混合二項分布である。正解数のデータから$\alpha, \beta$を推定することができる。Morrison & Brockway(1979, Psychometrika)をみよ。
 なお、$p$の極化の程度を表す指標として
 $\phi = 1 / (\alpha+\beta+1)$
が便利。等質母集団なら$\alpha,\beta$は無限大、すなわち$\phi$は0に近づき、両極母集団なら$\alpha, \beta$は0付近、すなわち$\phi$は1に近づく。

 この$f(p)$を事前分布とし、ある対象者が$k$試行中何回成功したかという値によって分布をベイズ更新し、$p$の事後期待値 $E[p | r of k]$を求めることができる。あとの選好課題とかでのウェイティングにも使える。
 [... ほかにサンプルサイズの話、反応時間の話など載っていたけれど、あんまり厳密な議論じゃないのでパス]

 ... なるほどね。勉強になりました。
 この論文は官能検査のdouble triangle testについての論文だけど、guessing可能な項目群への反応データからその人の特性を推測する場面すべてに通じる話だろうと思った。潜在特性に分散がなくても正解数には分散が生じる。正解数が多い人は優秀だと早合点する前に、正解数の分布をきちんと調べるのが大事だ。

 double triangle testの話に戻ると、一般には、2試行両方で正解した人を正解者とみなし、帰無確率の下での正解者の割合が母比率1/9の二項確率に従うとみなして二項検定を行うことが多い。帰無仮説の下で2試行が独立だと仮定しているわけだ(この論文で言う等質母集団モデル)。でもさ、同じ人の二試行が独立なわけないじゃん?と、かねがね気になっているのだけれど、その証拠を得るうまい方法が思い浮かばなかった。この論文でやっているみたいに、正解数の分布と等質母集団モデルとの適合度をカイ二乗検定すれば、てっとり早く検討できるわけか...

論文:データ解析 - 読了:Morrison(1981) 2回続けて正解した人は優れた人か、それともただのラッキーな人か