« 読了:「壊れかた指南」 | メイン | 読了:「高度成長」 »
2012年5月 9日 (水)
前々から不思議に思っているのだけれど、ID-POSデータやスキャナー・パネル・データを使って特定の製品カテゴリの購買を分析する際、往々にして、対象カテゴリの購入記録だけを抽出して分析しているように思う。ほんとは「今日はどれも買う気にならないや」という選択行動だってあるはずなのに、それはあらかじめデータから除外してしまっているわけである。しかし、「どれも買う気にならない」理由は、その日の虫の居所だけではなく、価格やプロモーションとも関係しているだろう。カテゴリ購入決定の要因とブランド選択の要因は重なっているわけだ。つまり、カテゴリ非購入はただのランダム欠損ではない。分析対象から単に除外してしまっては、ブランド選択の諸要因の効果測定にバイアスが生じるのではないかしらん?
ネット調査によればインターネット使用率は100%近かった、なんていう調査結果に対しては鬼の首を取ったようにあざ笑う、意識の高い皆様が、販売記録に基づくブランド価値推定やプロモーション効果測定には特に異議を申し立てない。本質的には、どちらもinformative missingnessという問題を抱えていると思うんだけど。。。私にはどうもよくわからない。
Chib, S., Seetharaman, P.B., & Strijnev, A. (2004) Model of brand choice with a no-purchase option calibrated to scanner-panel data. Journal of Marketing Research, 41(2), 184-194.
題名の通り、「買わない」選択肢つきの選択モデルを購買記録データに当てはめる、という論文。カテゴリ非購入の来店が取り除かれてしまっているデータの正しい分析方法がわかるかも、と期待していたのだが、そうではなくて、カテゴリ非購入が含まれているデータで、カテゴリ購入有無とブランド選択の両方を適切にモデル化する、という話であった。
世帯 h が買い物 t においてあるカテゴリの製品を購入したかどうかを表す二値変数を y_{ht}、購入したときにそのブランド番号(1...J)を表すカテゴリカル変数を y*_{ht} とする(非購入時には欠損値を持つ)。価格を P_{htj}, 店内ディスプレイ有無をD_{htj}, チラシ広告有無をF_{htj}とする。
まず、カテゴリの効用 z_{ht} を想定し、z_{ht}>0 のときに y_{ht}=1になると考える。で、z_{ht}は{切片項、J 個のブランドのPとDとF, 買い置きの量, 誤差} の線形和であると仮定する。誤差項を別にすれば 3J+2 個の係数が登場するわけだが、それらはすべて世帯によって異なると考え(うわあ...)、\gamma_{1h}, \gamma_{2h}, ... と呼ぶ。また長さ(3J+2)のベクトルとみなして \gamma_hとも呼ぶ。誤差 v_{ht}はN(0,1)に従うものとする。
次に、ブランド j の効用 u_{htj} を想定し、それが最大であるブランドが y*_{ht} として選択されると考える。で、u_{htj}は{切片項、P, D, F, 誤差} の線形和であると仮定する。4つの係数はすべて世帯によって異なると考え、
u_{htj} = \alpha_{hj} + \delta_{2h} P_{htj} + \delta_{3h} D_{htj} + \delta_{4h} F_{htj} + \eta_{htj}
とする(識別のために \alpha_{h1}=0とする)。きちんと定義してないけど、(J-1)個の\alphaと3個の\deltaからなる長さ(J+2)のベクトルを\delta_hと呼んでいる模様。誤差 \eta_{htj} からなる長さ J のベクトル \eta_{ht} は、平均0, 共分散行列 diag(1, \sigma_{22}, ..., \sigma_{JJ}) の正規分布に従うものとする。えーと、ブランドレベルの誤差はブランド間で独立とみなしているわけだ。
識別の都合上、上の式を次のように書き換えておく。世帯h, 買い物tにおける各ブランドのP, D, F, \etaとブランド1のそれらとの差を、それぞれP', D', F', \eta'とし、
u'_{htj} = \alpha_{hj} + \delta_{2h} P'_{htj} + \delta_{3h} D'_{htj} + \delta_{4h} F'_{htj} + \eta'_{htj}
とする(ただし j = {2, ..., J})。\eta'_{ht} の分散共分散行列は、対角要素が(1+\sigma_{22}, 1+\sigma_{33}, ..., 1+\sigma_{JJ}), 非対角要素がすべて1になる。
ここに仮説をふたつ付け加える。第一に、カテゴリレベルの誤差 v_{ht}と、ブランドレベルの誤差\eta'_{ht2}, \eta'_{ht3}, ... が、共分散 \rho_{12}, \rho_{13}, ...を持つと仮定する。えーと、ブランドレベルの誤差はブランド間で独立だがカテゴリ-ブランド間では独立でない、と考えているわけだ。第二に、カテゴリレベルの係数ベクトル \gamma_h とブランドレベルの係数 \delta_h を縦に積み、驚くなかれ、共分散行列をそっくり自由推定してしまう。
。。。このやったらにリッチな、パラメータ数の多いモデルを,力づくでMCMC推定してしまう。著者らは先行研究でのいくつかのモデルを紹介し(多項ロジットモデルに「買わない」選択肢を追加するのとか、nested logitモデルとか、効用最大化のGEVモデルとか)、それらよりもこのモデルのほうが柔軟だと述べているが、細かいことはわかんないんだけど、さもありなんと思う。草木を薙ぎ倒し小川を踏み潰し、MCMCという名の重戦車で近隣諸国を蹂躙する、という感じだ。なんだかなあ、もう。
適用例は、コーラのスキャナー・パネル・データ、対象店舗(2店舗)のいずれかでコーラを買った人を対象する。コーラを買ってなくても、店舗来訪じたいは別カテゴリの購買記録でわかる。買い置き量は過去の買い物記録から推定する。ブランドはシェアの順に、ペプシ、コカコーラ、RCコーラ、PBの4つ。
モデルを当てはめた結果、holdoutデータへの説明率はnested logitモデルより改善した由。で、推定したパラメータについて細かく議論している。カテゴリ購入に効くのはペプシの値下げだ、とかなんとか。
私が理解し損ねているのかもしれないが、個々の消費者の選択行動という観点に立った時、モデルの組み方がなんだかぴんとこない。このモデルでは、各世帯においてブランドの価格がそのブランドの効用に与える価格の効果はブランド間で等しいことになっているが、価格弾力性がどのブランドでも共通だという仮定はちょっと直観に反すると思う。またこのモデルでは、各世帯においてどのブランドの価格の変化も大なり小なりカテゴリの効用に影響することになっているが、買わないブランドの価格がカテゴリ購買決定に影響するものだろうか。うーむ。
論文:マーケティング - 読了:Chib, Seetharaman, & Strijnev (2004) スキャナー・パネル・データのための「買わない」選択肢つきブランド選択モデル