読書日記: 2012年10月アーカイブ

« 2012年9月 | メイン | 2012年11月 »

2012年10月26日 (金)

Mac Nally, R., & Walsh, C.J. (2004) Hierarchical partitioning public-domain software. Biodeversity and Conservation, 13, 659-660.
　Hierarchical partitioningについて勉強しようと思って入手してみたら、「こんどRでhier.partというパッケージをつくったからみんな使ってねーん」というだけの、実質1pに満たない、ただのお知らせであった。これがoriginal paperになっているのって，どういうことよ... 暴動を起こしたい気分です。

論文：データ解析(-2014) - 読了：Mac Nally & Walsh (2004) hier.partをつくったから使ってね(あるいは，業績リストを長くする方法)

Travis, K.M. (1982) Price sensitivity measurement technique plots product price vs. quality perceptions. Marketing News. May 14, 6.
　えーと、市場調査で、製品なりサービスなりの価格についての消費者の知覚を調べるときに、オランダのvan Westerndorpという人が考えたPSMというテクニックを使うことがある。これがもう、海原雄山なら座敷ごと破壊しちゃいかねないくらいに、なんだかさっぱりわからない代物なんだけど...
　そのPSMをアメリカではじめて紹介した文献としてよく引用される資料。入手してみたら、AMA(米マーケティング協会)の一般向け雑誌のたった1pの記事であった。別にいま読む必要もないんだけど、積読リストを短くするためにさっさと読了。著者はplog research という会社の人で、検索するとTNS plog researchという会社がある(あった?)ようだから、TNSに買収されたのかしらん。
　PSMのチャートを描く際、価格を横軸にして「安すぎる」「安くない」「高くない」「高すぎる」の累積分布曲線を描く場合と、「安すぎる」「安い」「高い」「高すぎる」の累積分布曲線を描く場合とあるけれど、この説明では前者であった。またPSMの改訂を提案した山川・佐々木(2004)は、もともとvanナントカさんご自身が「曲線の交点だけじゃなくて曲線自体に注目しよう」と仰っておられたのだと紹介していたように思うが、この記事の時点ではもはや交点だけに焦点が当たっている感じだ。

論文：マーケティング - 読了:Travis (1982) アメリカよ、これがPSMだ

Matell, M.S. & Jacoby, J. (1972) Is there an optimal number of alternatives for Likert-scale item? Journal of Applied Psychology, 56(6), 506-509.
　しばらく前、Likert尺度の段階数の話が自分の中でちょっとブームになったときに、入手したい資料リストにいれて、そのまま忘れていた奴だと思う。これも別にいま読まなくていいんだけど、たった4pなので、整理の都合により読了。
　同一のLikert尺度項目群(40項目)について、尺度の段階数を2から19まで被験者間で動かし、回答がどう変わるか調べました、という実験。ほんとにそれだけ(信頼性や妥当性の検討は別の論文にしている模様)。のんびりしていて楽しい。
　回答者が全段階を使った割合は、2件法と3件法ではさすがに高いが、4件法より増えるともう変わらない。中央に回答する割合は、段階数が増えると減る。回答時間は、13,16,18,19件法で長く、あとはたいして変わらない。ふーん。
　関係ないけど、Green & Rao(1970, J. Mktg)という研究は、(MDS的な意味での)情報復元という観点からは6件法か7件法がいいと言っているのだそうだ。ふーん。

論文：調査方法論 - 読了：Matell & Jacoby (1972) k件法尺度項目の最適な k は？

2012年10月25日 (木)

Goldstein, W.M. & Beattie, J. (1991) Judgments of relative importance in decision making: The importance of interpretation and the interpretation of importance. In Brown & Smith (eds.) Frontiers in mathematical psychology. pp.110-137.
　どうしても手に入れられなかったので、著者のGoldstein先生にお願いしてご恵送いただきました。心から感謝。

　前半は、属性の重要性という概念についての整理。いわく...重要性研究には2つの意義がある。

トレードオフ状況下でのある人の決定を、その人の重要性判断によって予測することができたら、コミュニケーション上便利だから。
重要性判断というメタ認知はそれ自体に理論的な関心が持たれるから。

どちらにしても、人々が重要性判断において重要性というものをどう解釈しているかを知る必要がある。そもそも統計学においてさえ、重要性という概念は曖昧ではないか。
　判断や決定における「重要性」とは、ある複雑な全体(例, 選択肢)に対してその部分(例, 属性)が持っている関係性を指している。「重要性」には3つの解釈が入り混じっている:

relative sensitivity. すなわち、属性の水準の変化に対する判断・選択の反応性という解釈。
relative impact. すなわち、判断・選択の要約としての解釈。
psychological representations and processes. すなわち、刺激と反応の間に介在する心的プロセスの特徴としての解釈。

まずはrelative sensitivityについて。線形モデルの係数、限界代替率、辞書編纂型決定ルールにおける属性の順序、その他なんらかのparamorphicなモデルにおける係数がこれに入る。問題は、ふつう属性間では測定単位が違うのでsensitivityを比較できないという点だ。各属性に対する主観的重要性判断だって、いっけん直接比較できるようにみえるけれども、実は異なる属性の増加の間のなんらかの直観的な精神物理学的マッチングに基づいているかもしれない(「価格より機能が重要」という判断でさえ、機能のこのくらいの変化が価格のこのくらいの変化に対応するという暗黙的マッチングに基づいているかもしれない... ということだと思う)。
　relative impactについて。たとえば，ある属性による分散の説明率はrelative impactだ(その属性のsensitivityだけでなく、その属性の変動についての要約にもなっている)。ところが、ここで著者らはちょっと不思議なことをいいだす。

すでに述べたように，分散の分解はrelative impactという相対的重要性概念の典型例である。その理由はおそらく，その属性の水準が違っていたら決定がどう変わっていたか(relative sensitivity)という関心が，その属性の水準が分散していたせいでどれだけの変化が起きていたか，という問いへとつながるからであろう。しかし，impactの指標を提供するために分解できるのは，判断の変動性だけではない。異なる属性が直接的に比較可能な場合，もうひとつの方法として筋が通っているのは，相対的重要性を，その選択肢の全体的望ましさに対するそれぞれの属性の相対的貢献という観点から捉えることだ。[...]
　relative impactを表す諸指標は、ある統一的な特徴を持っている。そのことは次の点に注意すればあきらかである。決定が、特定の刺激セットにおけるある属性の水準によって影響されていた程度を表す指標は、それがなんであれ本質的には、決定パターンを要約する記述統計量である。relative sensitivityという概念は、もし環境が変化したら決定がこうかわるだろう、という予測的思考に依拠している。いっぽう要約統計量は、すでに生じてしまった決定に焦点を当てている。[...]

訳出してみてようやく得心した。著者らは、重要性指標が属性の値の分布情報に影響されているかどうかだけに注目しており(影響されていたらそれはrelative impact)、影響を与えている分布情報が代表値か散布度かはどうでもよいのだ。その結果relative impactは、Achenのいうlevel importanceとdispersion importanceの両方を含む概念になっている。これは要するに、視点の違いだなあ。統計学者Achenとちがい、心理学者である著者らにはこの二つをわざわざ区別する動機が乏しいのだろう。
　psychological representations and processes(長い...)について。属性の知覚的顕著性とか、その属性が強い感情的反応を誘発するかどうかとか、その属性が高レベルな目標なり複数の目標なりについての含意を持っているかどうかとか、そういうのがここにはいる。たとえば、TverskyのEBAモデルでは、aspectの選択確率はそのaspectがもともと持っている"weight"で決まる。あるいは、Trabasso & Sperry (1985,JML)の物語理解の研究では(うわあ...)、文章中の文の重要性判断はその文そのものというより物語全体の因果構造で決まる。こういう意味での重要性がprocess型の重要性である。決定の心的プロセスと関係しているにせよ、決定の結果とは全然関係ないかもしれない。

　後半は著者らの実験の紹介。実験1はGoldstein&Mitzel(1992,OBHDP), 実験2はBeattieさんの博論。
　実験1は、架空の研究室秘書さんがアパートを選ぶ場面で(属性は家賃とキャンパスからの距離)、彼女のデモグラ情報、重要性判断、選択肢集合(サンプル・セット)に対する選択結果を教示し、別の選択肢集合(タスク・セット)に対する彼女の選択を予測させるという課題。各選択肢集合は6つの選択肢からなる。どうやら、Goldstein(1990)でのwideセットをサンプル・セットに、narrowセットをタスク・セットに使っている模様。
　重要性判断は2属性へのポイント配分。選択は選択肢の順位づけ。要因は、重要性判断の教示(なし/「家賃70対距離30」/「30対70」)と選択結果の教示(なし/a/b)で、被験者内２要因(3x3)デザイン。理屈は書いてないが、選択結果教示 a は重要性配分「70対30」と、bは「30対70」とそれぞれ整合する由。
　順位づけ回答を6選択肢の総当たり戦(15ペア)と捉え、安いのが勝った回数を指標とする。結果は... 重要性判断教示も選択結果教示も回答に影響する(そりゃまあそうだろう)。両方教示すれば両方とも影響する。要するに、他者の選択についての推論において、他者の重要性判断の結果が利用されていますね、という話。
　実験2は、80個の短いシナリオを読ませる。それぞれのシナリオはトレードオフの関係にある2つの選択肢からの選択を求めている(例、明日がレポート提出日なのに結膜炎にかかっちゃいました。痛い思いをして提出しますか、進級をあきらめますか)。で、各属性(目の痛みと進級)の重要性を11件法で評価した後、決定がどのくらい難しいと思うか、決定にどのくらい時間がかかりそうか、正しい決定ができそうか、というメタ認知的判断を求める(決定は求めない)。変な課題を考えたものだ。
　その結果、属性間の重要性評定値の差が小さいときに、決定は難しく時間がかかり不確実だと感じられた。要するに、自分の決定についてのメタ認知において重要性判断が用いられていますね、という話。
　というわけで実験からの示唆は、重要性というものは、relative sensitivityやrelative impactのような刺激-反応関係の特徴としても解釈されているし、決定の心理的過程の特徴としても解釈されていますね、ということなのであった。

　実験はまあ横に置いておいて、前半の理論的整理のところがとても勉強になった。私はいま市場調査に関わっているから、ずっと選択・選好に対する重要性指標の基準関連的妥当性のことばかり考えていて、主観的重要性が決定の心的過程についての回答者のメタ認知を表しているという側面はノイズだと思っていたのだけれど、たしかにそうした側面も興味深いし、決定プロセスについての初期のメタ認知がその後の決定プロセスそのものに影響してしまう面もあるだろう。あんまりpsychologicalな話になると、だんだん嫌になってくるんだけど。

　気になったところをメモ:

主観的重要性と統計的重要性が一致しないという話のレビューとして、Slovic & Lichtenstein(1971, OBHP)が挙げられている。また一致するという方向の研究としてReilly & Doharty (1989, OBHDP), Suber(1985, OBHDP)というのが挙げられている。ふうん。
relative sensitivityの説明のくだりで著者らは、線形モデルの係数はここに含まれる、normalizeされていようがいまいが、と述べている。うーむ。標準化回帰係数は属性の水準の分布に影響されるから(分散が大きいときに小さくなる)、relative sensitivityではないような気がするんだけど...
著者らいわく、relative sensitivityとrelative impactが常に区別できるとは限らない。選択肢の空間がxとyの二次元上に張られていて、各選択肢のxとyが計測されていて、選択肢の望ましさをD(x,y) = exp(x)+exp(y)で決まるとする。xのrelative impactを exp(x)/(exp(x)+exp(y)) としよう。xのrelative sensitivityは\partial D(x,y)/\partial x とすると、合計が1になるように規準化すれば結局これも exp(x)/(exp(x)+exp(y))になる。そりゃまあ、そうですね。

論文：調査方法論 - 読了：Goldstein & Beattie (1991) 重要性の解釈の重要性

2012年10月24日 (水)

Mullins, G.W., Spetich, B.L.S. (1987) Importance-perfformance analysis. Visitor Behavior. 2(3), 3-12.
　いわゆる重要性-パフォーマンス分析(製品なりサービスなりの諸属性について、評価と重要性を2軸に取った散布図のこと) の紹介記事。たった2p。たまたま見つけたので目を通した。
　結構いい加減な解説で、パフォーマンス軸のことをhow well the programs (=属性のこと) performs と説明したり、satisfied-unsatisfiedと説明したりしている。それとこれとは違うでしょうに。

論文：調査方法論 - 読了：Mullins & Spetich (1987) 重要性-パフォーマンス分析のご紹介

Myers, J.H., Alpert, M.I. (1977) Semantic Confusion in Attitude Research: Salience Vs. Importance Vs. Determinance, Advances in Consumer Research, 4, 106-110.
　Van Ittersumらの重要性指標研究レビューで、ある属性が重要であるという概念がsalience,relevance,determinanceに分類されていたが、その典拠として引用されていた論文(ただし、relevanceはここではimportanceと呼ばれている)。これ、カンファレンスのproceedingsらしく、webに全文がHTMLで掲載されていた。ざっと目を通したのだが、画面上ではやっぱり読みづらい。

気になったところをメモ。3つの概念の定義の歴史について。

salienceの最初期の定義は、 Krech & Crutchfield (1948)の社会心理学の教科書。Fishbein(1971)にも登場する。操作的には、自由想起の順序のこと。
importanceは、もともとあいまいな概念。通常は直接評定で調べる(って書いてある...)。Fishbein/Rosenberg流の多属性態度モデルを修正し、この重要度指標を適用しよう、という試みが多い(Wilkie & Pessemier, 1973, JMR というのが引用してある)。
determinanceは著者らがMyers&Alpert(1968)で定義した概念。

Alpert(1971, JMR)はdeterminanceをこう定義しているのだそうだ。ある属性について、
(determinance) = (stated importance) x (perceived differences among products)
概念の定義に"stated"という操作的な特徴づけが含まれているところが気持ち悪いけど、言いたいことはよくわかる。上のdifferencesというのは、ある閾値を超えた差異が存在するかどうかとして解する見方(thresholdモデル)と、分散そのものだと解する見方(parametric model)がある由だが、後者はまさにAchenのいうdispersion importanceだ。

　論文後半は手法間比較研究のレビュー。昔の話なのであまり関心が持てず、流し読み。どうでもいい感想だけど、この頃にUSで態度調査の手法開発をしていた人は(Johnsonさんとか)、きっと楽しかっただろうなあ。フロンティアという感じで。

論文：調査方法論 - 読了：Myers & Alpert (1977) 重要性という概念の曖昧さ

2012年10月23日 (火)

ときめくきのこ図鑑 (Book for Discovery) [a]
堀博美 / 山と渓谷社 / 2012-09-21
きのこの図鑑，というよりも写真集，ならびに素人向けきのこ解説書。
詳しく知りたい人は，全国各地のきのこサークルが主催する観察会に参加するとよい，とのこと。そんなのがあるのか。

ハドリアヌス　─ ローマの栄光と衰退 [a]
アントニーエヴァリット / 白水社 / 2011-10-07
ローマ皇帝ハドリアヌスの伝記。著者はジャーナリスト出身の人だそうで，読み物として面白かった。

若松孝二11・25自決の日三島由紀夫と若者たち [a]
若松孝二 / 游学社 / 2012-06
今月惜しくも事故で亡くなった若松孝二監督が昨年撮った，同題名の映画についての書籍。
　映画のほうは，良い映画かどうかは正直言ってわからないのだけれど，その内容が劇場を出たあとの日常にも浸食してくる，というようなインパクトのある作品であった。
　楯の会の青年達とともに死に向かう三島を，映画はぴったりと寄り添うようにして描写するのだけれど，あの市ヶ谷のバルコニーの演説の場面では，三島の叫び声だけがむなしく響き。。。こういっては大変失礼だけれども，やはりあのシーンは，かなりコミカルに感じられた。映画の見方にもちろん正解はないだろうけど，そういう見方でよかったのかなあ，と後であれこれ考えた。

ノンフィクション(2011-) - 読了：「ときめくきのこ図鑑」「ハドリアヌス」「11.25 自決の日」

秋津 1 (ビームコミックス) [a]
室井大資 / エンターブレイン / 2012-10-15
苛烈な暴力描写が特徴の作家が描くホームコメディ。なかなか面白い。

千年万年りんごの子(1) (KCx(ITAN)) [a]
田中相 / 講談社 / 2012-07-06

予告犯 1 (ヤングジャンプコミックス) [a]
筒井哲也 / 集英社 / 2012-04-10

87CLOCKERS 2 (ヤングジャンプコミックス) [a]
二ノ宮知子 / 集英社 / 2012-10-10

すみれファンファーレ 2 (IKKI COMIX) [a]
松島直子 / 小学館 / 2012-09-28
これはいいマンガだなあ...

サカタさんのペット大好き坂田靖子よりぬき作品集 (ピュアフルコミックス) [a]
坂田靖子 / ジャイブ / 2012-10-06

コミックス(2011-) - 読了：「秋津」「千年万年りんごの子」「予告犯」「87 Clockers」「すみれファンファーレ」

Van Ittersum, K., Pennings, J.M.E., Wansink, B., vanTrijp, H.C.M. (2007) The validity of attribute-importance measurement: A review. Journal of Business Research, 60, 1177-1190.
　製品なりサービスなりの属性についての重要性測定の妥当性研究のレビュー。数年前から仕事の合間に読み漁っている話題そのもの、4年前には自分でわざわざデータ取って学会発表までした話題そのもの、なのだが... いっちゃなんだけど、レビュー論文なのにgoogle scholar上の引用元件数がたった30件。どういうことなのか。さらに不思議なのは、重要性概念の多義性は統計学の分野でも話題になっているし(Kruskalとか)、心理学者の実証研究もあるのに(Goldsteinとか)、この論文は全然触れていない。好意的にみると、重要性とはそれだけ幅広い話題だ、ということなんだろうけど...

　まず妥当性研究のレビュー。13本の実証研究を、収束的妥当性と法則定立的(nomological)妥当性に分けて整理。著者らは重要性測定が直接的評定か統計的推定かという観点からは分けていないので、コンジョイント課題から得た部分効用に対する主観的重要性の予測的妥当性の研究(Jaccard et al.(1986, JCR)とか)は、ここでは収束的妥当性に分類されている。どうやら、単純な選択や選好評定に対する予測的妥当性研究がnomologicalと分類されている模様。

　で，著者らいわく... これまで指摘されてきた重要性測定の妥当性の低さは、そもそも重要性概念が多次元的だったから生じていたのだ。Myers&Alpert(1968,JMR)に従えば、属性の重要性の次元には以下の3つがある。

salience。対象について考える際、当該属性が心に浮かびやすいか。
relevance。その人の価値・信念に照らしての、当該属性の重要性。
determinance。そのときどきの判断・選択における、当該属性の重要性。

ここで，属性についての情報はrelevanceとdeterminanceに影響する。属性の水準についての情報はdeterminanceにのみ影響する。また，relevance→salience, relevance→determinance, determinance→salienceという影響がある。
　さて、重要性測定の方法には10種類ある。そのうち，属性自由想起はsalience、｛重要性直接評定、ランキング、ポイント配分、AHP、情報呈示ボード｝はrelevance、｛多属性態度法、トレードオフ法、スウィング・ウェイト法、コンジョイント法｝はdeterminanceを測定しているのである。
　その証拠に，さっきレビューした妥当性研究を含め，同一属性の重要性を複数種類の方法で測定している論文を34本集め，それらによって可能である計91個の手法間相関を，上記3群の群間比較と群内比較に分けてみると，見よ，群間での相関は低く(弁別的妥当性がある)，群内では相関が高く(収束的妥当性がある)，従属変数との関係は群内では同程度ではないか！という主旨。
　実は上記に反する研究も結構多いんだけど(むしろそっちのリストのほうが長い)，個別に難癖をつけていく。いわく，

きっと情報処理のちがいのせいだ。ポイント配分は同時評価，直接評定は分離評価だ。具体的属性の重要性は同時評価で高くなりがち。そのせいで同一群内の手法間相関が下がる。
きっとフレーミングのせいだ。たとえば，属性の水準情報を含んだ課題のあとだと，たとえポイント配分であってもdeterminanceを表すであろう。こうして群間の手法間相関があがってしまう。

　示唆としては... 実務的には3つの重要性がすべて大事。将来の研究としては，MTMMアプローチでの検証や，検査再検査法での信頼性研究が必要だ。云々。

　うーん...
　先行研究レビューとしては大変な労作だなあ，と思う。さすがにプロの研究者たちだ。重要性概念が多義的であるせいで妥当性が低く見積もられている，という主張についても全く同感だ。重要性の3分類も納得できる。著者らのいうrelevanceとdeterminanceとは，Goldsteinがいうsensitivityとimpact, Achenがいうtheoretical importanceとlevel/dispersion importanceのことであろう。重要性測定手法の分類も大変勉強になった。
　その上で思うのだけれど... 属性情報や水準情報が明示されているかどうかどうかで手法を分類するというアイデアは，美しいけれども，現実の回答の心的過程に目をつぶっていることになるのではないか，と思う。実際，まさにいま手元にあるデータがそれを表しているのだけれど，水準情報を明示しない属性の重要性ランキング課題においてさえ，たとえば「ホントはおいしさが一番だけど，いまどきどの製品もおいしさは同程度だから，価格が一番重要です」というふうに回答する人が少なくないのである。水準情報を明示していない聴取方法であっても，回答者は市場における属性の分布(「おいしさの分散は小さい」)について勝手に考慮してしまうのだ。
　調査手法を分類しその性質を特徴づけようとするとき，その鍵になるのは，調査者側がどんな情報を明示しているかどうかではなく，回答者側が実際にどう考えて答えているか，でなければならないのではないかしらん。

　10種類の手法のうちいくつかについてメモしておくと:

情報呈示ボードは水準情報を呈示しているのでdeterminanceに入りそうなものだが，どのボードをめくるかは水準では決まらないので，relavanceに分類されている。Ford, et al. (1989, ODHBP)というのが引用されている。
多属性態度法というのはFishbeinのことではなくて，全体的態度と属性の評価を聴取し回帰で重要性を導出すること(ありがちですね)。
トレードオフ法とは，異なる製品の魅力が等しくなるように水準を調整させる課題。Keeney&Raiffa(1976, 書籍)というのが引用されている。市場調査でいえばBPTOみたいなものかしらん。
スウィング・ウェイト法とは，どの属性を改善したいかを順に聴取していく方法(Von Winterfeldt & Edwards, 1986, 書籍)。

最後のやつ，恥ずかしながら初めて聞いたが，本棚を調べたら，先日買ったJane Beattie追悼論文集で紹介されていた。本は買ってみるものだ。

論文：調査方法論 - 読了：Van Ittersum (2007) 重要性測定の妥当性が低いのはなぜか

2012年10月19日 (金)

Bas, D. & Boyaci (2007) Modeling and optimization I: Usability of response surface methodology. Journal of Food Engineering. 78, 836-845.
　食品科学の分野での、応答曲面モデル(RSM)をつかった研究のレビュー。ずっと前に欲しい資料リストにいれていて、そのまま忘れていたのだが、このたび必要な論文をかき集めた際にうっかり一緒に入手してしまい、もったいないので目を通した。著者はトルコの方で、Basのsの下にはヒゲがついており、Boyaciのiには点がない。世界は広いなあ。
　まず、RSMについてざっと紹介。次に、先行研究(だいたい'00年代の)をひとつひとつ取り上げ、不備をぐりぐりと指摘する。楽しそうなのだが、残念ながらすべての例について、単語が全くわからず、したがって実質的な中身がさっぱりわからない。いきなり"... worked on lipase catalyzed biochemical reaction, incorporation of docosahexaenoic acid into borage oil" なんて言われても、なんの呪文かと... (いまこの行に限って辞書を引き引き推測するに、リパーゼというものをつかって、ドコサヘキサエン酸というものを、ルリジサ油というものに混ぜるかなにかなさろうという話であろう。世界は広いなあ)
　しょうがないから総評のところだけメモしておくと... 全般に独立変数についての予備調査が足りない。そのせいで最適点を見つけ損ねている研究が多い。また、データにあるすべての変数を二次多項式に放り込んではいけない。変数のとる範囲を調整するとか、次数の検討とか、変数の変換とかが大事。というような仰せである模様。よくわかんないけど。
　ほんとは応答曲面モデルでパラメータを最適化するための実験計画のレビューを期待していたのだけど、触れていなかった。Myers & Montgomery を読むしかないか...

論文：データ解析(-2014) - 読了：Bas & Bayoci (2007) 応答曲面モデルの使用例レビュー

2012年10月18日 (木)

Crown, W.H. (2010) There's a reason they call them dummy variable: A note on the use of structural equation techniques in comparative effectiveness research. Pharmacoeconomics, 28(10), 947-955.
　タイトルがあんまり魅力的なので、ついうっかり入手してしまった。観察研究で介入効果を推定する際、一本の回帰式に介入有無のダミー変数をいれることが多いけど、もっとましな方法がいっぱいあるのですよ、という啓蒙論文。紹介されているのは、構造方程式モデル(あまりピンとこなかったのだけど、多母集団モデルのことなのかしらん)、regression-based decomposition methods (えーっと、賃金格差の研究なんかでよく使う、男の回帰モデルに女の平均ベクトルを突っ込むようなやつだと思う。「要因分析」と訳すのだろうか)、傾向スコア、道具的変数、事前-事後データのdifference-in-difference分析。それぞれの説明が短くて、かえって混乱してしまった。

　関係ないけど... この論文のタイトルにあるCER(比較効果研究)という言葉、オバマ政権の医療制度改革の話の中でよく出てくるけど、あれってなんなんだろう、EBMやヘルス・テクノロジー・アセスメントとどうちがうのかしらん。ど素人の漠然とした印象では、CERが一番サツバツとした雰囲気の用語だという気がするんだけど... 似た言葉がいっぱいあって困るなあ。

論文：データ解析(-2014) - 読了：Crown (2010) ダミー変数はdummyだ

2012年10月11日 (木)

Unlu, A., Kiefer, T., Dzhafarov, E.N. (2009) Fechnerian scaling in R: The package fechner. Journal of Statistical Software, 31(6).
　客観的にはたいしたことないんだろうけど、主観的には「年に一度」級の、ややこしいデータ解析の課題を抱えていて、どうアプローチすればよいのか思い悩んでいる。たまたま R のfechnerパッケージというのをみつけて、なんだかわかんないけど、これだ！これでブレイクスルーだ！と喜んだが、ちゃんと読んでみたら、もう全くのぬか喜びであった。全然関係ないじゃん。まあ、せっかく目を通したので記録しておく。

　ええと、Fechnerというのは、心理学の入門コースに出てくる19世紀の哲学者、フェヒナーさんのこと。Fechnarian scalingというのは耳慣れない言葉だが、Dzhafarovさんという人が提唱している考え方らしい。素人目には非計量的MDSみたいなものなのだけれど、いわく、全く違うアプローチなのだそうであります。
　いま n 個の対象があって，すべての2個の間の弁別確率，ないしそれに類するなんらかの非類似性が与えられているとする。この正方行列に基づいて対象に数量を与えようとする手法としては、すでにMDSがあるけれど，Fechnerian scalingはそれより制約が緩い。対角要素が 0 でなかろうが，非対称であろうが，A-B間非類似性とB-C間非類似性の和がA-C間非類似性より小さかろうが、いっこうに構わない。ただ以下の条件さえ満たしていればよいのである。

任意の対象 i が，それとの非類似性がほかのすべての対象との非類似性よりも小さい対象 j をひとつだけ持っていること。この j を，i の主観的等価点(PSE)と呼ぶ(うわー，精神物理学だ...)。
i のPSE が jだったら，jのPSEはiであること。

　えーと，要するに，正方行列の各行に最小値がひとつだけあり，その値はその列での最小値でもある，ということですかね。この制約をregular minimalityという由。
　で、この条件が満たされているとき，対象間に計量心理学的な距離を与えることができるんだそうだ... このパッケージはその計算をやってくれるのだそうだ...

　細かいところを読んでいないせいだろうけど、どういうときにどういう風に便利なのか、全くわからなかった。いきなりRのパッケージの説明を読んでいるのが悪いのだろう。

論文：データ解析(-2014) - 読了：Unlu, A. et al. (2009) 「フェヒナリアン尺度構成」をやりたい人にとっては夢のようなRパッケージ

Theil, H. (1987) How many bits of information does an independent variable yield in a multiple regression?, Statistics & Probability Letters, 6, 107-108.
　重要性についての研究をあれこれ調べていると、統計学方面では重回帰の決定係数を独立変数へと分配するというタイプの提案が脈々と続いているのだが(それにどんな意味があるのかは別にして)、この論文もそのひとつ。
　よく引用されているようなので、国会図書館に籠って資料探しした際についでに手に入れてみたら、たった2pのノートであった。別にいま読むことはないのだが、積読リストが1行でも短くなるとうれしいので、さっさと読了。

　重回帰モデルの重相関係数をR、従属変数 X_0 と独立変数X_1, X_2, ..., X_p との相関係数をそれぞれ r_{01}, r_{02}, ..., r_{0p}、X_2を取り除いた X_0とX_1の偏相関係数を r_{01|2}とする("|"は原文では\cdotだが、読みにくいので略記する)。ここで下式が成り立つ:
1 - R^2 = (1 - r^2_{01}) (1 - r^2_{02|1}) \cdots (1 - r^2_{0p|12\cdots(p-1)})
両辺について2を底にした対数をとる。I(x) = -log_2 (1-x) と略記することにして、
I(R^2) = I(r^2_{01}) + I(r^2_{02|1}) + \cdots + I(r^2_{0p|12\cdots(p-1)})
I(R^2)は, 独立変数群によって与えられた X_0 のふるまいについての情報の量を、ビットを単位として表したものであるといえる。上式はこれを独立変数に分配している。つまり、重回帰式における独立変数の重要性を求めたことになる。
実際には、独立変数にはふつう順序がないので、Kruskal(1987)にならって、独立変数のすべての順列をつかったp!本の式をつくり、結果を平均すると良いでしょう、とのこと。
このアイデアの特長は:

Kruskal流のアプローチを、情報理論における情報量の加法性という性質で自然にサポートしている。
Kruskalのアプローチでは、すべての順列について平均してはじめて重要性が決まるのだが(えーと、そうだっけ?)、このアプローチでは各順列について決まる。
この重要性は相対的な指標ではなく、ビット単位で表現される絶対的な指標だ。
R^2より I(R^2)のほうが自然だ。R^2=0.98, 0.99, 0.999というのはほとんど同じだが、I(R^2)=5.64, 6.64, 9.97 というのはずいぶん違うでしょ？

う・う・む。。。

論文：データ解析(-2014) - 読了：Theil(1987)：決定係数を分配する方法(情報量バージョン)

2012年10月10日 (水)

勝てないアメリカ――「対テロ戦争」の日常 (岩波新書) [a]
大治朋子 / 岩波書店 / 2012-09-21
米軍の帰還兵のなかで，PTSDに並び外傷性脳損傷が問題となっているのだそうだ。戦場で路肩爆弾の爆風を受けた兵士が，外傷はないのに記憶障害や不眠などに悩まされるケースが多発していて，これは微細な脳損傷のせいではないか，と考えられている由。最新鋭の装備によって兵士が死ななくなった代わりに浮上した，新しい問題であるとのこと。

中世のパン (白水Uブックス) [a]
フランソワーズ・デポルト / 白水社 / 2004-10-15
フランスを中心とした中世ヨーロッパの，パンとパン屋にまつわるあれこれについて述べた本。
　パンの価格統制の話が興味深かった。いまの感覚からすれば，パンを規格化し原材料費の変動にあわせて価格を統制すればよいと思いがちだが，14世紀までは発想が逆で，パンの価格を決め，原材料費の変動に会わせてパンの重さを統制していたのだそうだ。パンは焼くと重さが変わるから，定期的に試作実験をしないといけないし，大変に面倒に思われるのだが...

ノンフィクション(2011-) - 読了：「勝てないアメリカ」「中世のパン」

すみれファンファーレ 1 (IKKI COMIX) [a]
松島直子 / 小学館 / 2012-03-30
絵柄が大変に素人臭いので敬遠していたのだけれど，これは良いマンガであった。欠落を抱えた家庭で，家族が互いに気をつかいまくる。今江祥智さんの名作「優しさごっこ」を思い出した。
　第一話(著者の新人賞受賞作) は，主人公の10歳の娘が，離婚して別居している父に会いに行き，父の後妻と飯を食って帰ってくるという話だが，なんでもないエピソードのなかに，切り裂くような激情がある。こういうのは一生に一度しか描けない類の作品だろうなあ，と感心した。

シュトヘル 6 (BIG SPIRITS COMICS SPECIAL) [a]
伊藤悠 / 小学館 / 2012-05-30

花咲さんの就活日記 1 (IKKI COMIX) [a]
小野田真央 / 小学館 / 2012-09-28
30過ぎて廃業を決意した売れない漫画家の話。読んでて辛い，嫌な汗が出てくる。その年齢なら全然ツブシが効くだろうに，と思う面もあるのだけれど，本人にとってはそういう問題ではないんだよな。。。

昭和元禄落語心中(3) (KCx(ITAN)) [a]
雲田はるこ / 講談社 / 2012-10-05

ドロヘドロ 17 (BIC COMICS IKKI) [a]
林田球 / 小学館 / 2012-09-28

コミックス(2011-) - 読了：「シュトヘル」「花咲さんの就活日記」「昭和元禄落語心中」「ドロヘドロ」「すみれファンファーレ」

2012年10月 5日 (金)

Ding, M. (2007) An incentive-aligned mechanism for conjoint analysis. Journal of Marketing Research, 44(2), 214-223.
　たいしたことをしているわけではないのに、こういうことをいってはいけないのだけれど、私は少々疲れているようである。
　なにかその、仕事とも実人生ともなあんにも関係なくて、気楽に読めて、頭の体操になるようなものでも持って、コーヒーショップにでも籠って、気分を変えよう。と思ったのだが、あいにくカバンに本がはいっていない。仕方なく、偶然見かけたキャッチーな論文を印刷して外に出た。truth-telling gameだなんて、面白そうじゃないですか。難しくて手におえなかったら、居眠りでもすればよい。
　で、夜更けの閑散としたスタバのソファーでパラパラめくり始めたら、これが仕事と関係ないどころか、おおありで...

　背景や目的や理屈をすっとばして実験手続きについていえば、こういう実験である(実験1)。実験が行われたのはiPod Shuffleが発売された一ヶ月後。被験者は大学生・大学院生で、デジタル・プレイヤーの購入に関心がある人、49人。実験群と統制群に折半する。

まず、以降の実験手続きについて正確に教示する。また、実験に登場するiPod Shuffleとそのアクセサリについて詳しく説明する。ところで、iPod Shuffleにはギフトセットというのがあり(「アスリート向けセット」とか)、本体と周辺機器がパッケージになっているそうである。
コンジョイント課題。iPod Shuffleの3種類のパッケージを提示し、そのなかのひとつ、ないし「どれも買わない」を選択するよう求める。パッケージを構成している属性は、本体の記憶容量、ケース、ヘッドフォン、スピーカ、カーオーディオ、電源、保証、価格(どれがどれだかわからないが、2,2,3,3,3,3,3,4水準だそうである)。これを24試行繰り返す。
[実験群のみ] コンジョイント課題には登場していない、ある特定のパッケージ X を提示する。Xは全員同じ。
妥当性チェック課題。ここまでに登場していないパッケージを16個並べて提示し、そのなかからひとつ選ぶよう求める。被験者が選んだパッケージを Y とする。
最後に報酬を渡す。

この報酬というのが要因操作になっている。まず、全員に10ドル渡す。さらに抽選を行い、40～50人にひとりの割合で、当選者を選ぶ。

統制群では、当選者にはパッケージ Y と、250ドルからYの金額を引いた額を渡す。いいかえれば、当選者は250ドルもらうかわりに、その金の一部を払って、妥当性チェック課題で自分が選んだパッケージを買わなければならないわけだ。
実験群では、各当選者についてコインを投げる。表が出たら統制群と同じ。裏が出たときがややこしい。
- あらかじめ、コンジョイント課題におけるその人の反応に基づき、パッケージ X に対するその人の支払意思額を推定しておく。仮にそれが100ドルだったとしよう。
- あるランダムな値を発生させる。その値は、0ドルからある上限額までの一様分布に従う。実験に登場するすべてのパッケージの価格はその範囲に入っている。その値をxとしよう。
- もしxがその人の支払意思額(100ドル)よりも上だったら、単にその人に250ドルを渡して、おしまい。
- もしxがその人の支払意思額以下だったら、その人にはパッケージ X と、250ドルからxを引いた額を渡す。いいかえれば、その人は250ドルもらう代わりに、ランダムな金額xを払って、パッケージXを買わなければならないわけだ。

　こうして書いてみると、先生いったいなにがしたいんですか？という感じだけど、ひとことでいえば著者は、対象者がコンジョイント課題で正直かつ真剣に答えてくれるような報酬の仕組みを提案しているのである。
　著者はこの課題を、被験者と実験者とのあいだの不完全情報ゲームとして捉えている。被験者は、自分の選好構造という私的情報を、ある方略に基づいて提示する。実験者の反応は提示された情報で決まる。で、ゲーム理論の観点からみると、実験群の被験者にとって自分の利益が最大になる方略(ベイジアン・ナッシュ均衡)は、自分の支払意思額を実験者に正確に推測させることだ、ということが証明できるのだそうである。

　うーむ... あれこれ考えてみたのだが、素人にも直観的にわかる説明としては、おそらくこういうことではないかと思う。教示を受けた実験群の被験者は、自分が運よく当選し、さらにコインの裏が出た場合について想像するだろう。Xがどんなパッケージかはまだ教わっていないが、そのXに対する自分の本当の支払意思額が、たとえば100ドルだったとしよう。
　コンジョイント課題における自分の回答から推定された支払意思額が、たとえば110ドルだったらなにが生じるか。

ランダムな値 x が、もし110ドルより大きかったら、パッケージXは買わずに済む。
もしxが100ドル以下だったら、本当の支払意思額以下のお買い得価格 x で X を買える。
問題は x が110ドル以下で100ドルより大きかった場合だ。このときは、自分の本当の支払意思額 (100ドル) よりも高い額で、無理やり X を買わされる羽目になる。これは避けたい事態だ。

　いっぽう、コンジョイント課題の回答から推定された支払意思額が、たとえば90ドルだったらなにが生じるか。

ランダムな値 x が、もし100ドル以上だったら、パッケージ X は買わずに済む。
もし x が90ドル以下だったら、本当の支払意思額以下のお買い得価格 x で Xを買える。
問題は、xが100ドルより小さく90ドルより大だった場合だ。このときは、 X を自分の本当の支払意思額(100ドル)より安いお買い得価格 x で買えるところだったのに、結局買えずじまいになる。これは避けたい事態だ。

　すなわち、避けたい事態とは、自分の本当の支払意思額と、コンジョイント課題で推定された支払意思額とのあいだのスキマに、ランダムな値 x が落ちてしまうことだ。そういう事態を避けるためには、スキマをなるべく小さくしておく必要がある。そのために、コンジョイント課題には真剣かつ正直に答えよう、と被験者は考えるだろう。
　... というような理屈ではないかしらん。

　実験で注目する結果指標は、被験者が妥当性チェック課題で選んだパッケージ Y と、コンジョイント課題の回答に基づきその人が選ぶと予測されたパッケージとの一致。統制群では24人中4人、実験群では25人中9人で一致した。つまり、コンジョイント課題で推定した効用の妥当性は、期待した通り、実験群で高くなった。云々。

　いやあ、面白かった。被験者がホントに著者のいうような考え方をしているのか、この手法そのものにどのくらい実用性があるのか、回答の妥当性向上は調査コストの増大に見合うのか、そのへんにはいろいろ議論がありうると思う。でも、リサーチにおいて正直な回答が報われるようにインセンティブの仕組みを調整しましょう、そのためにリサーチをゲーム理論の観点から分析しましょう、という発想が、私にはとても新鮮だった。

　支払意思額を正直に表明してもらうために、その人の支払意思額とランダムな値で報酬を決めるというアイデアは、Becker, DeGroot, & Marschak(1964, Behavioral Science)が考えたのだそうだ。これは経済学の研究だが、市場調査での応用としてはすでにWertenbroch & Skiera(2002, JMR)というのがあるらしい。この論文は、支払意思額の表明をコンジョイント課題で行うという点にオリジナリティがあるのだと思う

論文：予測市場 - 読了：Ding (2007) 調査対象者が正直かつ真剣に回答したくなるような仕組みのご提案

2012年10月 3日 (水)

江戸の思想史―人物・方法・連環 (中公新書) [a]
田尻祐一郎 / 中央公論新社 / 2011-02
「妙貞問答」から平田篤胤まで，日本近世の思想家たちを幅広く紹介した本。面白かった。ひとりひとりについての紹介がどうしても短くなってしまい，いささか不満がたまっちゃうんだけど...

日本近現代史 - 読了：「江戸の思想史」

大奥 8 (ジェッツコミックス) [a]
よしながふみ / 白泉社 / 2012-09-28
性役割が逆転した架空の江戸時代を舞台にした人気作品の最新刊。あまりに面白くて，もう徳川吉宗は女だとしか思えなくなってしまった。

テルマエ・ロマエV (ビームコミックス) [a]
ヤマザキマリ / エンターブレイン / 2012-09-25
ご都合主義的展開が，とても楽しい...

いつかティファニーで朝食を 1 (BUNCH COMICS) [a]
マキヒロチ / 新潮社 / 2012-09-07
都会に生きるアラサー女性たちの(いっちゃなんだがちょっとありがちな)悲喜こもごもを織り交ぜつつ，関東地方の実在の飲食店を紹介する，という連載。
　マンガとしての良し悪しは横に置いておいて，不思議だったのは，このマンガの想定読者である。素直に読めば30代女性なのだが，掲載誌の新潮社「コミック＠バンチ」って，そういう雑誌だっけ？どうもよくわからない。コミック誌は単行本で採算をとっているので，あのくらいの部数の雑誌の場合，もうそういうことはあまり気にしないのだろうか。それとも，実はマンガ好きのオッサン向けに描いている，とか？

シュトヘル 4 (BIG SPIRITS COMICS SPECIAL) [a]
伊藤悠 / 小学館 / 2011-04-28
シュトヘル 5 (BIG SPIRITS COMICS SPECIAL) [a]
伊藤悠 / 小学館 / 2011-10-28
この作品も，実に面白い...

コミックス(2011-) - 読了：「いつかティファニーで朝食を」「大奥」「テルマエ・ロマエ」「シュトヘル」

Haaijer, R., Kamakura, W., Wedel, M. (2001) The 'no-choice' alternative in conjoint choice experiments. International Jounal of Market Research, 43(1), 93-106.
　離散選択型コンジョイント・モデルで「どれも選ばない」選択肢をどう扱うか、あれこれ考えていたらだんだん混乱してきちゃったので、頭を整理するために他のを脇にどけて急遽読んだ。基礎ができていないと、これだから、もう。

　著者らいわく、「どれも選ばない」の扱い方には2種類ある。

多項ロジットモデルに、「どれも選ばない」選択肢の効用を表す定数をいれる。えーと、それってつまり、「どれも選ばない」選択肢でのみ 1 になるような属性があると考える、ということですよね？
入れ子型多項ロジットモデル。「どれも選ばない」という(選択肢がひとつしかはいっていない)ネストと、「どれが選ぶ」というネストがあると考える。

後者のモデルはむやみにややこしくなっちゃうんじゃないかと思ったが、案外そうでもない。まず、「どれか選ぶ」ネスト内のモデルは通常の選択モデルと変わらない。「どれも選ばない」ネスト内の選択モデルはいらない。ネスト n の選択確率は，ネストn' 内の全選択肢の効用の総和をV_{n'}として、
　P(n) = exp(\lambda V_n) / \sum_{n'} exp(\lambda V_{n'})
となる。\lambdaをdissimilarity coefficientと呼ぶ由 (これが 1 ならば通常の多項ロジットモデル)。というわけで、パラメータは 1 つしか増えていない。「どれも選ばない」つき多項ロジットモデルと同じである。

　2つの実データセットについて、「どれも選ばない」つき多項ロジットモデル、入れ子型多項ロジットモデル、ふつうの多項ロジットモデル(「どれも選ばない」選択肢はすべての属性のダミー変数を 0 にして表現する)、の3つを比較。当然ながら、ふつうの多項ロジットモデルは歪む (線形推定している属性があるときは特に)。どちらのデータセットでも、「どれも選ばない」つき多項ロジットモデルの適合度が良かった由。

　著者らいわく、「どれも選ばない」つき多項ロジットモデルがよいか、入れ子型多項ロジットモデルがよいかは、回答者が「どれも選ばない」選択肢を選んでいる理由によって決まる。回答者がまずどれか選ぶかどうかを決め、次にどれを選ぶかを決めている場合は、入れ子型多項ロジットモデルがよい。いっぽう、回答者がどれも魅力に感じないせいで「どれも選ばない」を選んでいる場合には(もしくは、選ぶのが難しくて「どれも選ばない」に逃げている場合には)、「どれも選ばない」つき多項ロジットモデルがよい。逆に言えば、両方のモデルを当てはめて適合度を比較すれば、回答者がどっちの方略を用いているのかについての示唆が得られる。。。とのこと。
　うーむ、筋は通っているけど、ちょっと思弁的な感じがする。それって実証できる話じゃないですかね。選択課題とプロトコル分析を組み合わせるとかで。

論文：データ解析(-2014) - 読了：Haaijer, Kamakura & Wedel (2001) 選択型コンジョイント分析における「どれも選ばない」選択肢の扱い方

2012年10月 1日 (月)

　先日、勤務先の仕事の関係でお会いした方に、突然にこんなことを云われて面食らった。「フィッシュバイン・モデルをご存知ですか？」え、えーっと、それ、なんでしたっけ... と、数秒間アタマが真っ白になった。すいません、すいません。
　心理学者Fishbeinの名前は、社会心理学の厚めの教科書を探せば出てくるかもしれないけど(たぶん態度のところで)、あまり有名とはいえないだろう。しかし、マーケティング系の人が関心を持つ消費者行動論の文脈では、ブランド選択・購買の背後にある態度形成についての古典的なモデル(多属性態度モデル)の提唱者として、それはもう大変なビッグネームなのである。

　思わぬ名前が思わぬところで勤務先の仕事と関係してきたので、これを機に、以前非常勤先の講義でFishbeinモデルについて触れた際に疑問に思ったことを、ちょっと調べてみようと思った次第。ほんとは、こんなことしてる場合じゃないんだけど...

　態度形成のモデルとしてのFishbeinモデルは、どのように説明されているだろうか。
　たとえば、いまgoogleで最初の頁に出てきた解説はこうだ。日本の伝統ある市場調査会社のひとつ、マーケティング・リサーチ・サービスの方による解説である。

ある商品例えばケーキに対する態度Aは、このモデル式によれば「栄養価が高い」という認知Pと「そのことは価値がある」という重要度Iとを掛け合わせた値を、他の属性（味、見栄えなど）についても求めて、それらを加算した結果A=ΣPIで決まるとする。提唱者の名をとってフィッシュバイン・モデルとも呼ばれる。

書き手のかたが云わんとしているのは、おそらくこういうことだろう。いまここにケーキがある。話を単純にするために、ケーキの属性として「おいしさ」と「見栄えの良さ」だけを考えよう。花子さんからみて、このケーキの「おいしさ」の認知は20, 「見栄えの良さ」の認知は10。いっぽう花子さんにとって、「おいしさ」の重要度は+1, 「見栄えの良さ」の重要度は+3。このケーキに対する花子さんの態度は、20*(+1)+10*(+3)=50。
　Fishbeinモデルは大筋このように説明されている。ところが。。。さまざまな説明をよく見比べてみると、説明の仕方が微妙に、しかし決定的に、異なるのである。

1. 教科書におけるFishbeinモデル

　ためしに、いま書棚にある消費者行動論の教科書をめくって、Fishbeinモデルについての説明を抜き書きしてみよう。
　どの説明も、ある対象とその属性群についての、ナニカとナニカの積和がその対象に対する態度である、という点では共通する。説明の間の主な相違点は3つある。

上記の説明での「認知」にあたるものをどう呼んでいるか。
上記の説明での「重要度」にあたるものをどう呼んでいるか。
上記の説明での「重要度」にあたるものは、対象×属性の組み合わせに対して付与される値か、それとも属性そのものに付与される値か。すなわち、対象によって異なるのか，(同一カテゴリ内であれば)異なる対象間で共通なのか。

　抜き書きにあたっては、もしその本のなかにFishbeinモデルを数式でフォーマルに説明している箇所があったら、その部分を優先的に抜き書きすることにする。

タイプA. 対象×属性についての「信念の強さ」と、属性への「評価」の積和
対象がある属性を持っているという「信念の強さ」と、その属性そのものに対する「評価」(対象間で共通)の積和、という説明。このタイプの説明が一番多い。

タイプAの説明に従えばこういうことになる。いまここにケーキがある。花子さんの、このケーキがおいしいという信念の強さは20, 見栄えが良いという信念の強さは10。いっぽう花子さんにとって、任意のケーキが「おいしい」という属性を持っているということに対する評価は+1, 「見栄えの良さ」については+3。このケーキに対する花子さんの態度は、20*(+1)+10*(+3)=50。

杉本徹雄(編著)(2012)「新・消費者理解のための心理学」p.119 (執筆: 杉本徹雄)

$A_j = \sum_{i=1}^n a_j b_{ij}$
ただし、
$A_j$ = ブランド$j$ に対する全体的態度
$a_i$ = 属性 $i$ の評価的側面
$b_j$ [原文ママ] = ブランド $j$ が属性 $i$ を有することについての信念の強さ
$n$ = 属性の数

下から2行目の $b_j$ は$b_{ij}$ の誤りであろう。

上記引用のほか，Sheth & Mittal (2004) "Consumer Behavior: A Managerial Perspective", 2nd edition., Blackwell, Miniard, & Engel (2006) "Consumer Behavior", 10th edition., 井上崇通(2012)「消費者行動論」, 守口剛・竹村和久(編著) (2012)「消費者行動論」の説明もこのタイプであった。

タイプB. 対象×属性についての「信念の強さ」と、対象×属性への「評価」の積和
対象が属性を持っているという「信念の強さ」と、その対象におけるその属性に対する「評価」の積和、という説明。A.とのちがいは，「評価」が対象ごとに異なるという点である。

タイプBの説明に従えばこういうことになる。いまここにケーキがある。花子さんの、このケーキがおいしいという信念の強さは20, このケーキは見栄えが良いという信念の強さは10。いっぽう花子さんにとって、このケーキのおいしさに対する評価は+1, 見栄えの良さに対しては+3。このケーキに対する花子さんの態度は、20*(+1)+10*(+3)=50。

田中洋(2008)「消費者行動論体系」pp.96-97.

Attitude = $f(\sum_{n=1} b_i e_i)$
態度は態度の対象への感情(affect)の独立変数である。
$b_i$は信念の強さであり、主観的な度合いとして表現される。態度の対象が i 番目の属性について持っている信念。たとえば、コカコーラの味が甘いと思っている程度。
$e_i$はその $i$ 番目の属性について持っている評価的側面。たとえば、コカ・コーラの味が甘いことがどの程度良いあるいは悪いか。
$n$ は態度対象の顕出属性 (salient attribute) の数である。
[...] ある対象に対する態度はその新商品を学習する過程で自動的に修得されるものであり、その学習の結果は商品属性についての信念という形で表されるのである。[...] さらに、消費者はこれらのブランド属性についてある評価を持っている。これらは「ミニ態度」とでも呼ぶべき存在であり、こうしたミニ態度は感情(affect)である。[...]
フィッシュバインの理論における信念の強さと属性評価は、たとえば、つぎのような質問によって測定される：
　
信念の強度を説明する質問の例：「パブロンには風邪の解熱成分が含まれている」
選択肢の例：まったくそう思う～まったくそう思わない(7段階あるいは5段階評価)
　
属性評価を測定する質問の例：「パブロンに含まれる風邪の解熱成分についてあなたはどう思いますか」
選択肢の例：とても良い～とても悪い (7段階あるいは5段階評価)

上の説明をよく読むと、「評価」のほうは、属性そのものについての評価(風邪薬に解熱成分が含まれていることの良し悪し)ではなく、対象が含んでいる属性についての評価(パブロンに含まれている解熱成分についての評価)となっている。ただし、この本では上記の説明のあとに、属性の「評価」が対象間で共通であるような分析例も紹介している。

　上記引用のほか，Peter & Olson (2001) "Consumer Behavior and Marketing Strategy", 6th editionもこのタイプであった。

タイプC. 対象×属性についての「信念の強さ」と、属性の「重要度」の積和
A. と似ているが，属性の「評価」が「重要度」と言い換えられている。

タイプCの説明に従えばこういうことになる。いまここにケーキがある。花子さんの、このケーキがおいしいという信念の強さは20, このケーキは見栄えが良いという信念の強さは10。いっぽう花子さんにとって、任意のケーキにおいておいしさという属性が持つ重要度は+1, 見栄えの良さという属性が持つ重要度は+3。このケーキに対する花子さんの態度は、20*(+1)+10*(+3)=50。

清水聡(1999)「新しい消費者行動」pp.123-124.

Fishbeinは、過去の態度形成の理論から、①消費者は、ある対象に対して多くの信念を持ち、その信念は、対象に関連したコンセプト・価値・目標で、対象とその信念の間との繋がりの強さが重要であること、②その信念のなかでも、評価的反応を持つ信念のみが、態度を形成すること、従って、③対象と信念の結びつき、その信念に対する評価の積和が、ある対象への全体的態度を引き出す、ということを導いた。式で示すと、
$A_o = \sum_{i=1}^n B_i a_i$
ただし、
$A_o$: 対象 $O$ に対する全体的態度
$B_i$: 対象 $O$ とその信念(属性) i の繋がりの強さ。即ち対象 $O$ が属性 $i$ とが [ママ]、どの程度結びついているのかを示す尺度
$a_i$: $B_i$の評価側面、即ち信念(属性) $i$ の重要度
となる。

ここでは「重要度」という言葉が「評価」と同義に用いられている。説明事例からみて、$a_i$は対象間で共通である。

上記引用のほか，Solomon (2009) "Consumer Behavior: Buying, Having, and Being", 8th editionもこのタイプ。

タイプD. 対象×属性についての「信念の強さ」と、「重要度」(何についてのかはっきりしない)の積和
「重要度」が対象によって異なるか，対象間で共通なのか、解説だけではわからないケース。

タイプDの説明に従えばこういうことになる。いまここにケーキがある。花子さんの、このケーキがおいしいという信念の強さは20, このケーキは見栄えが良いという信念の強さは10。いっぽう花子さんにとって、(任意の、ないし、この)ケーキにおいておいしさという属性が持つ重要度は+1, 見栄えの良さという属性が持つ重要度は+3。このケーキに対する花子さんの態度は、20*(+1)+10*(+3)=50。

青木幸弘ほか(2012)「消費者行動論」pp.72-73 (執筆: 青木幸弘)

このモデルでは、ある対象に対する個人の態度は、ある属性を当該対象が有すると思う個人の確信度(=期待)と、その属性の重要度(=価値)との積を、すべての属性について合計した総和に等しいと考えている。これを数式で表せば、
$A_o = \sum_{i=1}^n b_i a_i$
ただし、
$A_o$: ある対象 $O$ (製品やブランド) に対する評価 (全体的評価)
$b_i$: 対象 $O$ が属性 $i$ を備えている確信度 (信念の強さ)
$a_i$: 属性 $i$ の評価的側面 (重要度)
$n$: 属性の総数

上記引用のほか，杉本徹雄(編著)(1997)「消費者理解のための心理学」の説明(執筆:中谷内一也)もこのタイプ。つまり，この定評ある教科書におけるFishbeinモデルの説明は，1997年に出版された際はこのようにDタイプだったが，2012年の改版では上述のようにAタイプとなったわけだ。

タイプE. 対象×属性の「評価」と、属性の「重要度」の積和
ここまでの解説と大きく異なるのは，対象×属性の「信念の強さ」が「評価」と言い換えられている点。

タイプEの説明に従えばこういうことになる。いまここにケーキがある。花子さんの、このケーキのおいしさについての評価は20, このケーキの見栄えの良さについての評価は10。いっぽう花子さんにとって、任意のケーキにおいておいしさという属性が持つ重要度は+1, 見栄えの良さという属性が持つ重要度は+3。このケーキに対する花子さんの態度は、20*(+1)+10*(+3)=50。

平久保仲人(2005)「消費者行動論」pp.218-219

同じ地域のレストラン3店が検討集合に選ばれたとしよう。ある購買者が意思決定に影響を及ぼす属性として、内装、サービス、駐車場の広さ、レストランまでの距離、そして味を挙げたとする。まず、各属性の重要度を決める(1-5: 1=重要でない、5=とても重要)。次に各店をそれぞれの属性で評価する(1-5: 1=劣っている、5=優れている)。最後に属性の重要度と評価値を掛け合わせて、それら合計の最も高いブランドが選ばれるのだ[...]

いやあ、ちがうもんですね。AからEまで、実に5タイプのバリエーションがみつかった。

まとめると、Fishbeinモデルについての説明は、次の3つの点で揺れ動いている。

態度を規定する一方の要素は、対象×属性についての「信念の強さ」(A,B,C,D)か、「評価」(E)か
もう一方の要素は、「評価」(A,B)か、「重要度」(C,D,E)か
後者は属性についてのものか(A,C,E)、対象×属性についてのものか(B)、はっきりしないか(D)

　些細な違いにみえるかもしれないが、Fishbeinモデルは概念枠組みであるだけでなく、調査データを当てはめて活用するためのモデルでもある。調査項目を作る立場になって考えると、このちがいはなかなか馬鹿に出来ない。
　なんでこんな揺れが生じてしまうのだろうか。手元にある限りの資料で調べてみると...

2. 本家Fishbeinモデル

　まずはFishbeinさんご自身の定義から。このモデルの初出は、どうやらHuman Relationsという学術誌に載った1963年の論文らしい(もとは博士論文らしい)。この論文が手に入らないので、かわりにFishbein & Ajzen (1975)を探してみると、次のように説明されている(pp.222-223)。

[我々が提案したモデルは] さまざまな信念、そしてそれに関連している属性の評価が、結合ないし統合され、その対象の評価へと至る、そのありかたを記述するものである。[...] ある対象、行為、ないし出来事についての態度をAとする。その対象の属性についての信念、ないしその行為の帰結についての信念を b とする。その属性ないし帰結についての評価を e とする。統合のプロセスは下式で記述される:
$A = \sum_{i=1}^n b_i e_i$

　なお、この部分のすぐ後で、著者らはbを「対象がその属性を持っている主観確率」「行動がその帰結につながる主観確率」と言い換えている。
　ここでいう信念とは、その対象における顕著な信念(salient belief)のことである。それは人によっても対象によっても異なる。その数には限界があり、「全体での評価では、ふつう5個から9個の信念に落ち着く」。
　なお実証研究として、Fishbein(1963)は"Negroes"への態度について調査している(そ、それって...倫理的にどうなのかしらん...?!)。対象者群に、"Negros"の特徴を挙げるように求め、10個の属性を集める(dark skinとか、tallとか、uneducatedとか... エエエエ?!)。別の対象者群にそれらの属性を呈示し、

(a)その評価的側面についての5項目のSD評定、
(b)"Negroesがそれを持っている確率"についての5項目の評定、
(c)"Negro"の評価的側面についての5項目のSD評定、

を求める。(a)を足しあげて「評価」、(b)を足しあげて「信念の強さ」、(c)を足しあげて"Negroes"への態度とする。評価と信念の強さの積和は、態度と高い相関を持ちました、とのこと(p.225)。いやあ... 現代の目からみると、あんまりな調査だなあ。

　というわけで、Fishbein先生みずからの説明は...

態度を規定する一方の要素は、対象×属性についての「信念の強さ」
もう一方の要素は「評価」
「評価」は属性についての値

　ただし、ポイント3についてはよくわからない。Fishbein(1963)では、評価は属性名のみについてに対して聴取しているようだ("Negros"がdark skinであることについての評価ではなく、dark skinそのものの評価を聴取している)。これを真面目に受け止めればタイプA の説明に合致する。しかし、この研究では対象は"Negroes"しかないので、どうもはっきりしない。もしかするとFishbeinは、ほかに複数の対象を扱う実験をやっていて、そこではタイプBの説明のように、対象と属性の組み合わせごとに「評価」を聴取しているのかもしれない。

3. 後続研究における"Fishbeinモデル"

　さて、Fishbeinのモデルはたくさんの後続研究を生んだ。清水(2006)によれば、Kassarjianという人は、Fishbeinモデルを用いた研究は1980年までに100件以上にのぼる、とレビューしているのだそうだ(Kassarjian, 1982, Annual Rev. Psychology)。ひゃー。
　そのなかのひとつに、当のFishbeinさんと揉めているのがある。Bass&Talarzyk(1972)は、Fishbeinモデルでブランドの選好を予測しますという論文で、こう述べている。

For the purposes of this research, Fishbein's model is represented quantitatively as:
$A_b = \sum_{i=1}^N W_i B_ib$
where:
$A_b$ = the attitude toward a particular brand b
$W_i$ = the weight or importance of attribute i
$B_{ib}$ = the evaluative aspects or belief toward attribute i for brand b
$N$ = the number of attributes important in the selection of a given brand in the give product category

　平気な顔で Fishbein's model is represented as ... っていっているけど、よく見ると、本家と全然ちがう内容である。実証データをみてみると、対象×属性の「評価」「信念」は、たとえば「ミニッツメイドの味は？」という項目に対する「とても満足」から「とても不満」までの6件法で聴取されている。また属性の「重要度」は、オレンジ・ジュースのブランド選択における重要度の順に「味」「価格」などの属性を並べる、という課題で聴取されている。
　というわけで、Bass & Talarzyk (1972) が定式化するところの"Fishbeinモデル"はこういうモデルだ。

態度を規定する一方の要素は、対象×属性についての「評価」「信念」
もう一方の要素は「重要度」
「重要度」は属性についての値

　ずいぶん変わったものですね。タイプEの説明に近い。
　「信念の強さ」が「評価」に、「評価」が「重要度」に変化している点もさることながら、「信念」という言葉がFishbeinとはかなり違う意味で用いられている点も面白い。Fishbeinの場合、「信念」は対象がどんな属性を持っていると思うかを指している。いうなれば、「信念の強さ」は事実判断であって価値判断ではない。価値判断は別途、属性の「評価」として得られるのだ。それに対しBass & Talarzykは、「信念」という言葉を「評価」とパラレルに用いている。事実判断と価値判断は切り離されない。
　
4. 本家，お怒りになる

　これに対して、ご本家はさすがにお怒りになり、批判論文を発表する(Cohen, Fishbein & Ahtola, 1972)。この論文はBass & Talarzyk(1972)のほかに、Sheth & Talarzyk (1972)という別の研究もひっくるめて批判しているので、前者に対する批判のみ抜き書き。

彼らはFishbeinモデルの背後にある期待価値理論を理解しておらず、期待と価値をごっちゃにしている。彼らのいう「評価的側面ないし信念」は、Fishbeinのいう「信念の強さ」ではない。また、Fishbeinは「重要度」などという言葉は一度も使っていない。むしろこれまでずっと、重要度という指標の有用性を否定してきたのだ。彼らのモデルはいうなれば「属性適切性」と「重要度」のモデルだ。Fishbeinモデルとは関係ない。
態度構造のモデルを検証したかったら、そのモデルで予測されたある対象についての態度が、その対象についての他の態度指標と相関していることを示さなければいけない。Fishbeinのモデルは高い相関を示している。彼らのモデルは相関が低い。

　単に「おまえらのモデルはもうFishbeinモデルじゃねえよ」と怒っているのではなく，モデルを構成する概念に踏み込んで批判している点が興味深い。「重要度」という概念が不適切である理由について，Fishbein & Ajzen (1975)の説明を聞いてみよう。
　著者らにいわせれば、態度のモデルに「重要度」の出る幕はない。そもそも、重要度という言葉の指すところには次の3つがある(p.211)。

(1)ある人が知覚する属性の重要度。
(2)その対象を定義する特徴として知覚された重要度。
(3)ある人の態度の決定因として知覚された重要度。

　(1)の意味でいえば、「重要な属性はふつう、重要でない属性に比べてよりポジティブないしネガティブに評価される(すなわち、より極化する)。同様に、人々はふつう、自分たちにとって重要な物事についてより多くの情報をもっており、したがって、重要でない属性についてより重要な属性についてより確信があり、より強い信念を持っている。重要度、評価、信念の強度の間に一対一の関係はないが、近年の証拠によれば、$b_i e_i$ の絶対得点と重要度判断の間には高い相関があると示唆されている」(p.228)。
　(2)の意味の重要度は、対象と属性のあいだの結びつきの主観確率、すなわち「信念の強さ」に近い。
　(3)の意味での重要度評定は、(重回帰などで得られた)実際の決定における重みづけと対応していないことがわかっている。

5. 分家，反論する

　この批判に対し、Bass, Sheth, Talarzykはそれぞれ回答を寄せている。ほんとはSheth(1972)の回答がいちばん戦闘的で面白んだけど、話がそれるので省略して、Bass(1972)の回答は:

Fishbeinのモデルについてはよくわかりました。でもそれは、ある対象に対しての異なる人々の態度のモデルでした。いっぽう我々が提案したのは、異なるブランドに対する態度のモデルです。
したがってモデルの検証方法も異なって当然です。我々の観点からは、異なるブランドに対する態度の予測と選好が個人内で相関することが大事なのです。

　Talarzyk(1972)の回答は:

我々の目的はFishbeinモデルの検証ではない。"For the purposes of this research, Fishbein's model is represented quantitatively as..."と述べたことからもわかるように、我々はある程度の用語の変更が有益だと考えたのだ [そ、そうなんですか...]。
我々のモデルは、異なるブランドに対する態度の予測と選好の間の高い個人内相関を示している。

　いずれにせよ、モデルのなかの重要な概念がすり替わっちゃっている点については反論しないわけだ。

6. 本家に忠実な使い方とは？

　BassやTalarzykがいうように、ブランドに対する態度の予測というマーケティング的課題においては、Fishbeinモデルはそのままでは適用しにくいのだろうか。いやいや、そんなことないわよ、というわけで、Tuck(1973)は本家Fishbeinモデルに忠実な適用事例を示している。
　その手続きは次のとおり。調査対象はHorlicksという"bedtime drink"。wikipediaによれば、欧米では有名な商品で、粉末の麦芽飲料で(ミロみたいなものかしらん)、寝る前にお湯に溶かして飲むんだそうだ。いまでも現役の商品らしい。へー。
　まず、Horlicksのヘビーユーザー、ライトユーザー、オケージョナルユーザー、ノンユーザー各50人に、「夜Horlicksを飲むことについて考えたとき、心に浮かぶことを教えてください」とインタビューし、顕著な信念(salient belief)の項目セットをつくる。各群ごとに6～7項目。たとえば「Horlicksを夜に飲むと安眠しやすくなる」というような項目であるとのこと。
　次に、別の対象者の4群に質問紙調査を行う。

まず、各信念の評価的側面を聴取。たとえば「安眠しやすくなるなにかを飲むこと」に対して、それが良いことか悪いことかを尋ねる(「Horlicksを夜に飲むと安眠しやすくなる」に対する評価ではない!)。不思議なことに、Tuckさんは何件法で訊いたのかを書いていないように思う。
次に各信念の強さを聴取。「Horlicksを夜に飲むと安眠しやすくなる」に対して、extremely likelyからextremely unlikelyまでの7件法で訊く。
「Horlicksを夜に飲むこと」に対する全体的態度を聴取。good-bad, pleasant-unpleasantなど4つのSD尺度項目について評定を求める。書いてないけど、たぶん単純に足しあげるのであろう。

　予測された態度と実際の態度の相関は、ヘビーユーザー群から順に.51,.55,.68,.68と、十分に高かった、とのこと。
　Tuckさんいわく、大事なのは次の2点である:

いったいどんな態度を予測したいのか。それによって、用いるべき「顕著な信念」が異なってくる。ブランドに対する態度を予測したいのなら、ブランドについての信念を用いないといけないし、ブランド使用に対する態度を予測したいのなら、ブランド使用についての信念を用いないといけない。
この事例は、Bass-Talarzykの課題(異なるブランドに対する態度の予測を個人内で比較するという課題)とは確かに違うけど、この手続きの適用は可能でしょう。その際に気をつけないといけないのは、ブランドによって「顕著な信念」のセットを変えないといけない、という点である。

　前者の指摘は、Bass-Talarzykに限らず多くの人にとって耳が痛いところであろう。自分の身の回りを振り返ってみても、ブランド選好という言葉はあまりに柔軟に用いられているように思う。あるブランドが好きかどうかと、そのブランドを使用することが好きかどうかは、おそらくは異なる事柄なのだ。
　いっぽう後者の指摘に対しては、おそらくBassさんたちはちょっと異論があるのではないだろうか。ブランドによって信念リストを変えると、予測された態度をブランド間で定量的に比較するのが難しくなってしまいそうだ。

　ともあれ、Tuck(1973)が定式化するところの"Fishbeinモデル"は...

態度を規定する一方の要素は、対象×属性についての「信念の強さ」
もう一方の要素は「評価」
「評価」は属性についての値

　当然ながら、Fishbein先生みずからの定式化に近い地点に引き戻されている。ポイント3については本家よりも明確になっており、タイプA の説明に合致する。

7. Fishbeinモデルってどんなんだっけ

　というわけで、"Fishbeinモデル"を名乗る実証研究のなかでさえ、モデルの定式化においてズレが生じていたことがわかった。
　Fishbeinモデルくらいに有名なモデルになってしまうと、Fishbeinさん本人がどういったかだけではなく、研究史のなかでどのように受け取られたかも大事になってくるだろう。消費者行動論の教科書におけるFishbeinモデルについての説明の揺れは、"Fishbeinモデル"を活用した実証研究における定式化のズレを、そのまま反映しているのかもしれない。

※読んだ論文は:
Bass, F.M., Talarzyk, W.W. (1972) An attitude model for the study of brand preference. Journal of Marketing Research, 9(1), 93-96.
Cohen, J.B., Fishbein, M., Ahtola, O.T. (1972) The nature and uses of expectancy-value models in consumer attitude research. Journal of Marketing Research, 9(4), 456-460.
Bass, F.M. (1972) Fishbein and brand preference: A reply. Journal of Marketing Research, 9(4), 461.
Sheth, J.N. (1972) Reply to comments on the nature and uses of Expectancy-value models in consumer attitude research. Journal of Marketing Research, 9(4), 462-465.
Talarzyk, W.W. (1972) A reply to the response to Bass, Tararzyk, and Sheth. Journal of Marketing Research, 9(4), 465-467.

2012/10/11追記: 毒を食らわば皿まで、というわけで、下記の論文も読んだ。これに伴って、「本家に忠実な使い方とは？」の項を追加。
Tuck, M. (1973) Fishbein theory and the Bass-Talarzk problem. Journal of Marketing Research., 10(3), 345-348.

2012/10/20追記: 読み返したらあまりに冗長なので，教科書の引用を絞りました。やれやれ。

2016/06/29追記: 数式をMathJax表示にしました。ついでに説明をちょっぴり追加。

論文：マーケティング - 読了：Bass & Talarzyk (1972) ほか：Fishbeinモデルってどんなんだっけ