読書日記: 読了：08/24まで (A)

« 読了：08/23まで (A) | メイン | 読了：08/24まで (MA) »

2009年8月24日 (月)

Hahn, C., Johnson, M.D., Herrmann, A., Huber, F. (2002) Capturing customer heterogeneity using a finite mixture PLS approach. Schmalenbach Business Review, 54, 243-269.
　FIMIX-PLS法の解説論文。SmartPLSのBBSで紹介されていた。掲載誌はどういう雑誌なのか見当がつかないが，名前からすると「一橋ビジネスレビュー」みたいなもんかしらん。Webcatでみると所蔵図書館が110館もあるから，きっと有名な雑誌なのだろう。
　たとえば，顧客満足度について共分散構造分析のモデルを組んだとしよう。で，よくよく考えると顧客のなかにも異質性があるはずで，ある人々においては従業員の礼儀正しさから顧客満足に伸びるパスの係数が高いだろうし，別の人々においては店舗の品揃えのパス係数が高いだろう，というようなことを考えたとしよう。この場合，思いつくデモグラ変数で対象者を分けて，群ごとにパス係数を推定したりするのがオーソドックスなやり方だが，うまい切り口が見つかるかどうかは運次第だし，実は「男30代と女50代は従業員重視」が正解でした！。。。などという場合には，もうほとんどお手上げである。そこで登場するのが，有限混合分布モデルをつかって，対象者を潜在クラスにわけつつかつクラスによって異なる係数を推定する，というやり方である。
　いっぽう，顧客満足度のモデリングでよく使われる手法には，普通の共分散構造分析のほかにPLSモデリングもある。では，有限混合分布モデルをつかった PLSモデリングはできないのだろうか？できますとも，FIMIX-PLSをごらんあれ，というのがこの論文の主旨。数式のところは飛ばして読んだが，勉強になりました。
　アメリカのコンビニ顧客満足度調査データを使い，係数の異なる5つのセグメントを求めて見せる。デモグラ変数でアプリオリに層別した分析をいくらやっても，このセグメントに到達するのは難しい由。
　このモデルでは，顧客満足に対して10個の潜在変数からのパスが刺さっている。クラス数を変えながらパス係数を推定していくのだが，その際，どのクラスでも係数はすべて0以上，という制約をかけてしまう。著者らはこの制約の下での解を局所最適解と呼び，異なる初期値から繰り返し計算して，解が同じだったらそれは大域最適であるとみなしている。要するに，潜在変数は互いに独立だ，真の重回帰係数はすべて0以上になるはずだ，と前提しているわけだ。えええ？重回帰係数の符号が直感と逆向きになるのは，独立変数間に因果関係があることの証拠かもしれないではないか。Store LayoutとSafetyなんて，いかにも複雑な因果関係がありそうだから，どちらかの直接効果が負になってもおかしくない(店内の安全性さえ確保されていれば，棚のレイアウトはむしろ入り組んでいたほうが顧客満足が高い，とか)。解釈は難しいけど，それはそれで大事な知見ではないですか。
　そもそも，論文の主旨は有限混合分布に基づくセグメンテーションにあるのであって，独立変数が互いに独立だという想定は別に要らないのではないか？　なにもそんな制約をかけなくてもいいじゃん，と思ったのだが，察するに，こういう手続きを踏まないと負の係数が出まくってしまい，結果を解釈できなかったのかも。
　セグメンテーション後の分析が勉強になった。各対象者の事後確率を従属変数，デモグラ情報を独立変数にした回帰モデルを組む。なるほど，分類結果とデモグラのクロス表を取るよりも気が利いている。もっとも実務の文脈では，個人にセグメント番号ではなく所属確率が割り当てられるというのは，ちょっと受け入れられにくそうだ。(あとでSmartPLSのBBSを眺めていたら，そういうことを書いている人がいた)
　クラス数を決定する際に，どの適合度指標をみればよいのか(AIC, BIC, CAIC, ENのどれが良いか)を知りたかったのだが，書いてなかった。ま，全部みろってことかしらね。

論文：データ解析(-2014) - 読了：08/24まで (A)

読書日記

読んだ本を淡々と記録します

2009年8月24日 (月)