« 読了:「高度成長」 | メイン | 読了:Rothman & Parker (eds.) (2009) オール・アバウト・ちょうどよい尺度 »
2012年5月10日 (木)
Varki, S. & Chintagunta, P.K. (2004) The augmented latent class model: Incorporating additional heterogeneity in the latent class model for panel data. Journal of Marketing Research, 41(2), 226-233.
購買記録データをもとに世帯をセグメンテーションする際に、「世帯のなかには、どこかひとつのセグメントに属している世帯と複数のセグメントに属している世帯があるのだ」と考えるモデルを提案する論文。なんでそんなケッタイなことを考えるのかというと、たとえば一人暮らし世帯なら、きっとどこかひとつのセグメントに属しているだろうけど、夫婦世帯の場合は、夫が買い物する時と妻が買い物するときで属しているセグメントがちがうかもしれない、でもどっちが買い物したかはデータからはわからない... というような問題意識があるらしい。なるほど。ご苦労様なことだ。
Kamakura & Russell(1989)のモデル(LCM)から出発する。セグメント s に属する世帯 h が買い物 t においてブランド j を選択する確率を多項ロジットであらわす:
\lambda_{h|s \times jt} = exp(\nu_{h|s \times jt}) / \sum_m exp(\nu_{h|s \times mt})
ここで\nu_{hsjt}は 効用 (から誤差項を抜いたやつ) で、
\nu_{h|s \times jt} = \gamma_{sj} + X_{jt} \beta_s + Z_{hjt-1} \eta_s
ただし、\gamma_{sj}はセグメント s のメンバーにとってのブランド j の固有の効用、X_{jt}はマーケティング変数のベクトルで \beta_s は係数ベクトル、Z_{hjt-1}は前回の買い物で j を買ったかどうかを示すダミー変数で \eta_s は状態依存性を示す係数、である。
いっぽう著者らのモデルでは... 世帯のうち一定割合(q)は上記のモデルに従うが、残りの世帯(1-q)の選好は、各セグメントの選好の加重混合分布だと考える。つまり、世帯 h はセグメント s に対して重み g_hs を持っており(sを通じた合計が1になる)、買い物 t で ブランド j を選ぶ確率は、各セグメントのメンバーが持つ選択確率の重みつき合計だと考える。で、重みのベクトルはディリクレ分布に従うと仮定する(そろそろ蕁麻疹が...)。
著者らはこれを ALCMモデルと呼んでいる。よくわかんないけど、simulated MLで推定できるんだそうだ。
適用例は、スキャナー・パネル・データ、ピーナッツバター(4ブランド)とケチャップ(4ブランド)の2カテゴリ。マーケティング変数は価格と店頭プロモーション有無。各カテゴリのデータに、LCM, ALCM, 連続的なランダム効果モデル、それにrandom-shockがついてるやつ(Erdem, 1996 Marketing Sci.)、の4つを当てはめる。holdoutの予測はALCMで優れている、とかなんとか... 面倒なのでスキップ。
この数値例では、qはピーナッツバターで.58, ケチャップで.40と推定されたそうだが、真の q がどんな値でも、このモデルはうまくいくのだろうか。直観的には、もし多くの世帯が一人暮らしだったら、こんな工夫をすることにあまり意義がなくなり、むしろパラメータ数が増える分だけ損するだろうと思う。逆に、もしほとんどの世帯が夫婦ものだったら、なにがなんだかよくわからないセグメンテーションになっちゃうんじゃないかしらん。
論文:マーケティング - 読了:Varki, S. & Chintagunta, P.K. (2004) 一部の世帯が複数セグメントに所属することを許す購買行動セグメンテーション