読書日記: 読了：Carderon (2015) 製品選好を訊く新手法

« 読了：「神曲地獄篇」「コンビニ人間」「リア王」「カンディード」「怪盗ニック全仕事3」「夏に凍える舟」 | メイン | 読了：菅野(2011) ブランド・リレーションシップとはなにか »

2016年10月13日 (木)

Calderon, E., Rivera-Quintero, A., Xia, Y., Angulo, O., O'Mahony, M. (2015) The triadic preference test. Food Quality and Preference, 39, 8-15.
　消費者に製品の選好を訊く際の新手法を提案する論文。
　仕事の都合で急遽目を通したんだけど、これがなんというかその、かなり納得のいかない内容で...

　いわく。
　新製品開発では一対選好テスト(paired preference test)が良く使われている。"No preference"選択肢をいれておき、各製品の選好率をみたり、"No preference"率をみたりする。ある製品の選好の強さを測るために、信号検出理論でいうd'を応用したhedonic d'を使うこともある。
　一対選好テストの問題点として、仮に2製品が全く同一でも、かなり多くの被験者がどちらかを選好するという点が挙げられる。先行研究における回答分布はいろいろだが、たとえば40%-20%-40%。選好反応は製品属性だけでなく、なんらかの「外的要因」にも影響されているわけである。それら外的要因は、2製品が異なるときにも影響しているはずだが、その大きさはわからない。そこで、被験者に全く同じ2製品のペア(これをプラセボ・ペアと呼ぶ)についての一対選好テストと、異なる2製品のペア(テスト・ペアと呼ぶ)についての一対選好テストを求め、結果を比較する、という手続きが用いられることもある。

　一対選好テストにおける「外的要因」についての研究は２系統ある。
　ひとつは統計学的な研究で、プラセボ・ペアへの反応とテスト・ペアへの反応をどう比べるかという研究。カイ二乗検定とか、hedonic d'を使うとか...[中略]
　もうひとつは実験心理学的研究の系統で(本論文もこれに属する)、「外的要因」をどうやったら排除できるかを考える。先行研究としては、"No preference"を複数水準にすると合計の割合が増えるとか[←そりゃそうでしょうね]、"liking"じゃなくて"buying"の選好を訊くと"No preference"が増えるとか[←そりゃそうでしょうね]、韓国人はなぜか"No preference"が少ないとか[←へえー]、プラセボ・ペアに"No preference"反応をする傾向には安定性がないとか、いろいろあるけど、問題の解決には遠い。

　著者ら(Alfaro-Rodriguez, et al., 2007 Food Quality & Preference; Sung et al., 2011 J. Sensory Studies)は「プラセボ・ペアで"No preference"と答えた人がテスト・ペアでこう答えたか」に注目した研究を行ってきた。いわばプラセボ・ペアをスクリーナとして使うわけだが、サンプルサイズが1/3くらいになっちゃうのが欠点である。それに、プラセボ・ペアでは「外的要因」に惑わされた人でも、テスト・ペアでは製品属性の違いに目覚めて選好を回答してるかもしれない。
　問題は、消費者が「選好テストではどっちかを選好しなきゃ」と思っちゃっているという点にある。そういう思い込みを捨てて気持ちよく"No preference"とお答えいただき、スクリーナ通過者が増えるように、テストの外見と構造を修正したい。

　そこでtriadic選好テストをご提案します。
　3製品(実はうち2品が同一製品)を提示し選好を訊く。選択肢は、「2製品は同じ、残り1製品はそれより上」「2製品は同じ、残り1製品はそれより下」、「すべて同じ」、「3製品それぞれちがう」の4種類(紙に書いて見えるところに置いておく)。4番目の回答をした人はスクリーナを通過できなかったとみなし、除外して集計する。

　実験1。
　対象者は学生・大学職員、200名。刺激はジュース2銘柄(P,Q)。
　課題は2つ。課題1、通常の一対選好テスト。プラセボ・ペア、テスト・ペアの順。プラセボ・ペアはP-PとQ-Qの2種類(被験者を折半)。テスト・ペアはP-Q。休憩して、課題2、triadic選好テスト。
　結果。通常の一対選好テストでは、プラセボ・ペアに対する"No preference"は34%。triadic選好テストでは、スクリーナ通過者はなんと92%。

　実験2。教示をちょっと簡略化して変化をみる。[あんまり本質的な話じゃないと思うので略]

　考察。[プラセボ・ペアで選好が生じる理由について、急に大風呂敷を広げて議論しているけど、省略]

　いやあ。。。久しぶりに納得できない論文を読んだ。

　著者らいわく、同一の2製品(プラセボ・ペア)に対する選好テストで"No preference"率が低いということは、選好テストが製品属性以外のなんらかのノイズを被っているということを示している。ここまではわかる。
　そこで、そのノイズを減らすための工夫をしましょう、という話ならばよくわかる。また、ノイズを減らすのは難しいので、テスト・ペアだけでなくプラセボ・ペアについても選好テストを行い、プラセボ・ペアでの"No preference"率をノイズのサイズを表すベースラインにしましょう、という話であっても、よくわかる。
　いっそテスト・ペアとプラセボ・ペアを同一被験者に訊いちゃえ、という著者らのアプローチも理解できる。プラセボ・ペアで正しく"No preference"を選んだ人だけについて分析しましょう、というのも... おいおいずいぶん荒っぽい話だなとは思うけど、話の筋としては理解できる。
　しかし。この論文で著者らが云っているのは、そもそも選好テストにおける"No preference"反応率が不自然に低すぎるんだ、実験手続きを工夫して高めよう、という話なのである。あれれ？ "No preference"率の低さは選好反応におけるノイズの強さを表してるんじゃなかったの？そのノイズの元を絶たずして、外見上の"No preference"率だけを高くしてもしょうがないんじゃない？
　著者らが示さないといけないのは、(1)一対選好テストにおける"No preference"反応率が、日常生活における選好とは異なり、一対選好テストそのものの課題特性によって不自然に低くなっているのだというエビデンス、(2)著者らが提案している新手法が、単に外見上の"No preference"率を高めているんじゃなくて、選好テストにおけるノイズの低減(著者らの主張によれば課題特性によるバイアスの低減)に寄与しているんだというエビデンス、なのではないかと思う。
　(1)が難しいというのはわかる。著者らにいわせれば選好と行動とは異なる概念であるから、結局のところ真の選好を示す外的基準は手に入らない。代わりに著者らは先行研究からそれっぽい定性的知見を引き合いに出しているけど(被験者の事後インタビュー)、議論としてはあまりに弱い。たとえば、"No preference"反応の検査再検査信頼性が低いというような証拠を出せばいいんじゃないかしらん。
　(2)についてはいろいろ調べる手があると思う。プラセボ・ペアの2製品の製品属性をちょっとずつ変えていって、既存手法と提案手法の判別能を比較するとか？

　ところでこの論文、実験手続きについてもかなり疑問があって、たとえば、実験1の手続きは変だと思う。被験者内で従来手法と提案手法の順で聴取し手法を比較している(それも刺激を使いまわして)。仮に試飲のたびに少しずつ真剣さが増してたらどうすんだ。従来手法と提案手法は被験者間で比較するか、被験者内だとしてもせめて順序をカウンターバランスするべきであろう。

　まあいいや。著者らの筋立てを離れて、提案手法について考えてみると...
　著者らは一対選好テスト(日本の伝統的な官能検査用語でいうところの「二点嗜好法」)を改善したいという入口から入って、新しい選好テストを開発するんだけど、結局のところ著者らが提案しているのは、日本で「三点嗜好法」と呼ばれているあの悪名高き手続きに近い。ちがいは、三点嗜好法ではまず3製品のなかの同一2製品を識別するように求め、次に選好を訊くのに対して、著者らの方法では識別を問わず、いきなり3製品の選好順序(タイあり)を訊く、という点である。
　よく知らずに勝手なことを言うけど、官能検査の方面の方々はこういう手法を嫌うんじゃないかと思う。感覚刺激に集中してもらうために、反応課題の認知負荷をできる限り軽くしようとするからだ。「この三つのうちどれが同じですか」「では同一の二つと残り一つのどちらが好きですか」を別々に訊く三点嗜好法が、いろいろ問題はあるとはいえ長く用いられてきたのは、個々の反応課題を単純にすべしという信念の表れではないかと思う。それに対して、3つの刺激の選好順位づけ、しかもタイありってのは、認知的に結構むずかしい課題だと思うのだが、どうだろうか。選択肢を紙に書いて見えるところに置いておかないといけないということ自体、このテストの認知負荷の高さを表しているのではないか。

　さらにいうと(嗚呼、いちゃもんがあふれ出てくる...)、そもそも「同一刺激に対してどちらかを選好した人は分析から除外する」という、著者らの枠組み自体がいかにもローテクに思えてしかたがない。百歩譲って、選好判断において製品属性以外のノイズに影響されちゃう人とそうでない人がいるとして、その個人差は二値的ではなく連続的なものだろう。むしろ、個人差の確率分布を仮定したなんらかのモデルをつくって、プラセボ・ペアでうっかりどっちかを選好しちゃった人のテスト・ペアへの回答には小さな重みをつけ、プラセボ・ペアで正しく"No preference"と答えた人には大きな重みをつける、というような、うまい統計的分析を考えたほうがいいんじゃなかろうか。

　なんか文句ばっかりメモしちゃったけど、考察のところに面白い話があったのでメモしておく。選好判断の妥当性を調べた研究は少なくて、9件法ヘドニック尺度でいえば論文が2本しかないそうだ。Peryam, et al. (1960) がのちの選択行動との関連を、Rosas-Nexticapa et al.(2005, J.Sensory Studies)がのちの購買行動との関係を調べている由。えええ、そんなに少ないかなあ？それは官能検査方面に限った話で、マーケティング分野での上市後売上予測に関する研究のなかで、もっとあるような気がするんだけど？
　... おっと、また文句になってしまった。カルシウムが足りないのだろうか。

論文：マーケティング - 読了：Carderon (2015) 製品選好を訊く新手法

読書日記

読んだ本を淡々と記録します

2016年10月13日 (木)