elsur.jpn.org >

« 読了:「3月のライオン 4」ほか | メイン | 読了:「回顧七十年」 »

2010年4月15日 (木)

Blodgett, J.G., Anderson, R.D. (2000) A Bayesian network model of the consumer complaint process. Journal of Service Research, 2(4), 321-338.

マーケティング領域向けに,ベイジアン・ネットワークはこんなに便利ですよ,と宣伝する論文。このたび急遽ベイジアン・ネットワークの勉強をする羽目になり(「急遽××の勉強をする羽目」ばっかりだなあ),書籍には出てこない泥臭い話を読みたくて目を通した。とはいえ,これも一種の啓蒙論文なのだが。
小売店に不満を持った顧客について,クレームをつけるかどうか,今後の購入意向,他人にその店のことを話すか,などを予測するベイジアン・ネットワークを構築する。事前知識でもって決め打ちした有向非巡回グラフにデータを与えて学習させている。意外なことに,構造探索の話は全然出てこなかった。マーケティング分野の実務家はむしろそっちに関心を持つのではないかと思うのだが。
いろいろ不思議に思ったことが多かったので,二,三メモしておくが,ひょっとしたらとんでもない無知をさらすことになるかも...

これは本題から離れるが。。。モデル内の変数のうち「店舗へのloyalty」などの5つの変数は多重指標を持つ構成概念であり,7件法のlikert法項目を各概念あたり3つくらい持っている。で,ベイジアンネットワークに乗せるために,レベルを離散的に表現する変数を前もって生成する。たとえば「店舗へのloyalty」ならば,「そのお店は私のお気に入りのお店です」といった項目が4つあり,それらの項目の回答で,対象者をloyalty高群と低群に分類するわけである。α係数は0.7くらい。7件法の回答はとりあえず間隔尺度データとみなすとして,さて,どうするか。
もし俺なら,PCAなり1因子CFAなりをやって,第一因子得点の高低で分けると思う。いっぽう著者らは,各指標の標準化得点を用い,k-means法で2群に分けている。k-means法を使った理由は(1)平均がきれいに違うグループをつくれるから,(2)あとで別のデータをモデルに投入するときに判別分析を使えばいいので楽だから,(3)ソフトが簡単に手に入るから,とのこと。うーむ。。。そのセンスがいまいちわからない。うまく整理できないのだが,なんだか引っかかる。

論文:データ解析(-2014) - 読了:Blodgett&Anderson(2000) ベイジアン・ネットワークで顧客不満の分析