« 読了:「桜田門外の変」 | メイン | 読了:"The Apartment" »
2010年10月12日 (火)
Srinivasan, V., Abeele, P.V., Butaye, I. (1989) The factor structure of multidimensional response to marketing stimuli: A comparison of two approaches. Marketing Science, 8(1), 78-88.
勤務先の仕事でアレコレ思い悩むことがあって,さんざん探した末にようやく見つけた論文。いまの悩みにジャスト・フィット,とても助かった論文なのだが,世間がソーシャルだマーケティング3.0だっていっているときに,1989年の論文を見つけて喜んでいる俺っていったい。。。
複数の刺激を対象者に提示し,各刺激に対して複数項目への反応を測定すると,刺激×対象者×項目の三相データが得られる(値が箱の形に並ぶ)。このデータを二相に落として因子分析する際には,以下の3つのアプローチがある。
- total analysis ... 全刺激・全対象者を縦積みにしたローデータから得た共変動行列 T の因子分析。
- within analysis ... 刺激ごとに求めた共変動行列 W1, W2, ... を足し上げた行列 W の因子分析。
- among analysis ...縦積みローデータにおけるすべての値を,その刺激の平均に置き換えたデータから得た共変動行列 A の因子分析。
ここで T = W + A である。では,3つのアプローチの長所と短所は? ... という論文。
なお,上の「共変動行列」は,原文ではtotal sum of square and cross product matrix。対角要素が項目の偏差平方和,非対角要素が2項目の偏差の積和である行列のこと。共分散行列をデータサイズ倍したものだといってもよいだろう。なんといえばわからないので「共変動行列」と書いたが,そんな用語があるのかどうか知らない。まあとにかく,分散分析の古い用語でいえば,Totalは全変動,Withinは級内変動,Amongは級間変動を相手にするわけだ。
この論文自体は因子分析に焦点を当てているが,論文の主旨は因子分析に限らず,項目間相関に基づくすべての分析手法に当てはまるのではないかと思う。そこで勝手に一般化すると,こういうことになるだろう:
調査対象者100人に5つの製品なり広告なりを提示し,それぞれについて複数項目への反応を得た。項目間の相関を調べる際,次の3つのアプローチがある。
- 個々の製品のローデータを縦積みしたデータ(500行)から相関を求める。これが著者のいうTotal分析。
- 個々の製品のローデータ(100行)から別々に5つの相関係数を求める。著者の言うWithin分析に近い。
- 個々の製品における平均値の行列(5行)から相関を求める。著者のいうAmong分析に近い。
当然ながら,3つのアプローチは分析に用いる情報が全く異なる。Among分析はある製品に対する反応の個人差を無視しているし,Within分析は各製品の特徴のちがいを無視している。Total分析は両方を反映しているが,逆にいえばどちらを反映しているのか定かでない。では,どのアプローチが良いだろうか? ... こうして考えると,これはすごく身近な問題ですね。
さて著者いわく,対象者の反応構造には以下の基盤がある。
- (a)「意味的類似性」。すなわち,2項目が同じ構成概念の指標だと2項目間に相関が生じる。たとえば,クルマの修理回数と信頼性は高い負の相関を持つ。
- (b)「構成概念間の因果関係の知覚に基づく認知的整合性」。2項目が別の構成概念を表しているとき,2つの構成概念に因果関係があると知覚されていると,2項目に相関が生じる。たとえば,クルマの大きさと燃費。
- (c)「環境的相関に基づく認知的連関」。これがなかなか厄介な概念なのだが,どうやら,2項目が別の構成概念を表しており,2つの構成概念の間に因果関係は知覚されていないのだが,世の中において2つの構成概念間にたまたま相関があるものだから(それがなぜかは別にして),その結果として2項目間に相関が生じる... ということらしい。例に挙がっているのは,クルマがヨーロッパ車であることとスポーツ車であること,とか,広告がeye catchingであることとinformativeであること,とか。対象者にとってはeye catchingとinformativeの間に因果関係はないが,実際にはeye catchingにするためには文字を減らさねばならず,そのためinformativeは犠牲になる,したがって広告テストにおいてeys catchingとinformativeの間に負の相関が生じる,という話であろう。
さらに,相関の分析には以下の考慮事項がある。
- (d)データサイズ。足りないと困る。
- (e)刺激に対する親近性。ハロー効果とか。
- (f)等質性。刺激によって構造が違うと困る。
- (g)反応傾向。どんな項目にも高く(低く)反応する対象者がいると,項目間に相関が生じる。
- (h)分散。そもそも項目に十分な分散がないと,まともな相関は得られない。
さて,withinとamongを比較すると ... (a)(b)はどちらにも反映される。(c)の影響はamongで大。(d)もamongで深刻だ(そりゃそうだ,製品数がデータサイズになるのだから)。(e)はどちらにも影響する。(f)はwithinでは要チェック,いっぽうamongではどうチェックしたらいいのかわからない。(g)はwithinで深刻。(h)はどちらでも深刻で,withinでは十分な個人差,amongでは十分な刺激差が必要になる。
で,著者らの主張は。。。もちろんどれが優れているとはいえないんだけど,within分析はもっと使われてよいのではないでしょうか。いっぽう,対象者間分散と刺激間分散を無条件にプールして良いような場合であれば,Total分析(ないし,三相因子分析とかPARAFACとか)がいいけれど,そういう場面って少ないんじゃないですか。とのこと。論文には出てこないけど,平均構造を導入した多母集団因子分析は,著者らのいうwithin分析にあたるだろう。
論文の後半は,広告テストの実データを用いて3つのアプローチの結果を比較しているんだけど,そこはつまんないので流し読み。
俺が因子分析の文脈を離れて,やたらに一般化して考えているせいかもしれないんだけど,著者らの発想にいまいち共感できないところがある。
はっきり書いてないけれど,著者にとっての分析対象は(a)(b)に基づく項目間構造にほかならないのではないかと思う。で,著者らが思うに,その構造は,各製品に対する対象者の反応の構造(W1, W2, ...)にも,製品の平均値の構造(A)にも,したがって全体の構造(T)にも,等しく表れているはずなのである。著者らにとっての問題は,T, W, Aのどの行列を調べればうまく真の構造にたどり着けるかということだ。(c)「環境的相関に基づく認知的連関」や(f)「等質性」は,その障害物に過ぎないのだ。
なるほど,そういう見方もあるだろう。問題は,そういう見方が適切であるような状況がどこまで一般的か,ということだ。ほかの状況を想像することだって容易である。たとえば,(a)(b)だけでなく(c)「環境的相関に基づく認知的連関」にも等しく関心がもたれるケース。広告制作者にとっては,「これまでの広告を見る限り,eye catchingとinformativeとは両立しない」と気がつくことに,大きな意味があるかもしれない(それが消費者の広告認知メカニズムにおける因果関係なのか,世の中たまたまそうなっているからなのか,そんなちがいはどうでもいいよ,と思うかもしれない)。あるいは,(f)「等質性」がないこと,つまり各刺激に対する反応の構造が異なることが前提であるようなケース。たとえば製品テストにおいて,構成概念間の因果関係(b)がどの製品でも同じだとしたら,それはどの製品でも目指すべき改善方向は同じだということを意味する。それはちょっと変なのではないだろうか? 女の子A, B, Cさんのセクシャル・アピールは肌の露出によって生じているから,同一市場で競合する女の子Dさん,あなたももうちょい露出なさい,というようなものだ。彼女の場合,黒スーツに眼鏡をかけたほうがかえって色っぽいかもしれないのに。
結局のところ,これは分析の前提と目的の問題である。total/within/amongは,特定の前提のもとで,特定の目的に奉仕したりしなかったりするのである。だから,分析アプローチの処方箋をつくるためには,具体的な課題状況に即し,そこの状況で求められうる分析目的を精緻に定義しなければならない。たとえば,著者らはWithin分析は市場の現状に縛られないという意味で新製品開発に有益ではないかと示唆しているが,新製品開発においては市場の現状を知ることだって大事だろう。つまり「新製品開発」という言葉が広すぎるわけで,コレコレな新製品開発の局面において,コレコレな前提の下では,コレコレについて知るためにwithin分析を行いましょう,というところまで詰めないと,処方箋にはならないのである。。。などと書いているうちに,だんだんご奉公先の仕事の話に近づいてきてしまったので,このへんでストップ。
論文:データ解析(-2014) - 読了:Srinivasan, et.al. (1989) 三相データをどうやって二相に落とすか