« 読了:「3月のライオン 4」ほか | メイン | 読了:「回顧七十年」 »
2010年4月15日 (木)
Blodgett, J.G., Anderson, R.D. (2000) A Bayesian network model of the consumer complaint process. Journal of Service Research, 2(4), 321-338.
マーケティング領域向けに,ベイジアン・ネットワークはこんなに便利ですよ,と宣伝する論文。このたび急遽ベイジアン・ネットワークの勉強をする羽目になり(「急遽××の勉強をする羽目」ばっかりだなあ),書籍には出てこない泥臭い話を読みたくて目を通した。とはいえ,これも一種の啓蒙論文なのだが。
小売店に不満を持った顧客について,クレームをつけるかどうか,今後の購入意向,他人にその店のことを話すか,などを予測するベイジアン・ネットワークを構築する。事前知識でもって決め打ちした有向非巡回グラフにデータを与えて学習させている。意外なことに,構造探索の話は全然出てこなかった。マーケティング分野の実務家はむしろそっちに関心を持つのではないかと思うのだが。
いろいろ不思議に思ったことが多かったので,二,三メモしておくが,ひょっとしたらとんでもない無知をさらすことになるかも...
- このモデルでは「クレームをつける」ノードに向かって「クレームをつけることへの態度」「問題の統制可能性の知覚」「成功の見込み」の三つのノードからパスが伸びている。すべて二値変数なので,「クレームをつける」について2^3=8行の条件つき確率表を推定していることになる。そこには線形モデルで言うところの主効果も交互作用も表現されているはずだ(という理解であっているのだろうか?)。ところがこの論文の考察においては,3つのノードをひとつずつ固定して条件つき確率の変化を調べている(2*3=6行の表について考察している)。主効果しか調べていないわけだ。しかし,ほんとに面白いのは交互作用かもしれない。たとえば「クレームをつけるのが恥ずかしくない人は,店舗に責任があろうが,文句をつけても改善されそうにないことであろうが,もう見境なくクレームをつけちゃうのだ」とか。それに,仮に交互作用に関心がないとしても,もし交互作用が存在するなら,それは主効果の大きさについての実質的解釈が難しいということを意味すると思う(交互作用のせいで主効果がなくなる場合だってあるわけだから)。
- モデルから得られた知見として,「クレームをつけない」条件下での「二度とその店舗で買わない」確率は4%,つまり「クレームをつけない不満客は逃げる」という言い伝えは正しくないのだ,と述べているのだが... そもそも「二度とその店舗で買わない」事前確率が5%なのだ。小売店に不満を持った顧客のうち,逃げるのはたった5%? これは対象者条件(不満を持った人)が緩すぎるか,「逃げていく」の操作的定義(「二度とその店舗で買わない」という回答)がきつすぎるのではなかろうか。
これは本題から離れるが。。。モデル内の変数のうち「店舗へのloyalty」などの5つの変数は多重指標を持つ構成概念であり,7件法のlikert法項目を各概念あたり3つくらい持っている。で,ベイジアンネットワークに乗せるために,レベルを離散的に表現する変数を前もって生成する。たとえば「店舗へのloyalty」ならば,「そのお店は私のお気に入りのお店です」といった項目が4つあり,それらの項目の回答で,対象者をloyalty高群と低群に分類するわけである。α係数は0.7くらい。7件法の回答はとりあえず間隔尺度データとみなすとして,さて,どうするか。
もし俺なら,PCAなり1因子CFAなりをやって,第一因子得点の高低で分けると思う。いっぽう著者らは,各指標の標準化得点を用い,k-means法で2群に分けている。k-means法を使った理由は(1)平均がきれいに違うグループをつくれるから,(2)あとで別のデータをモデルに投入するときに判別分析を使えばいいので楽だから,(3)ソフトが簡単に手に入るから,とのこと。うーむ。。。そのセンスがいまいちわからない。うまく整理できないのだが,なんだか引っかかる。
論文:データ解析(-2014) - 読了:Blodgett&Anderson(2000) ベイジアン・ネットワークで顧客不満の分析