読書日記: 読了：Russell&Petersen(2000) 複数カテゴリ購買の確率モデル・最終章

« 読了：「終わりよければすべてよし」 | メイン | 読了：Johnston & Schwartz (1977) 不釣り合い型な一対比較実験データを重回帰で分析してみせよう »

2012年3月30日 (金)

Russell, G.J., & Petersen, A. (2000) Analysis of cross category dependence in market basket selection. Journal of Retailing, 76(3), 367-392.
　複数カテゴリ購買の確率モデル。仕事の都合でこの種の論文を何本か集めたのだが、これはコピーだけとって読んでなかった。仕事のほうは一段落しちゃったんだけど、せっかくだからざっと目を通した。

　いろいろ理を尽くして説明してるけど(ページ数が増えるわけだ)、要するに多変量ロジスティック回帰である。消費者 k が買い物 t においてカテゴリ i を買ったかどうかを表す二値変数を C(i,k,t)、その背後にある効用を U(i,k,t)とし、
　U(i,k,t) = \beta_i + HH_{ikt} + MIX_{ikt} + \sum_j \theta_{ijk} C(j,k,t) + \epsilon(i,k,t)
とする。HHは世帯特性、MIXはマーケティングミクス変数。CとUはlogitでつなぐ。このモデルから交差価格弾力性が導出できる由。
　モデルの適用例として、ペーパータオル、トイレットペーパー、顔用ティッシュ、紙ナプキンの4カテゴリについてのホームスキャンデータを分析。HHは前回購入からの期間とロイヤルティ。MIXは価格(その時点、その地域での購買価格を平均しているらしい)。\theta_{ijk}はカテゴリ(i, j)間の関連性の係数(世帯間で共通)と、世帯k における平均バスケットサイズに分解する。で、もっと簡単なモデルと比較して、データへの当てはまり(BICとhold outでの対数尤度)が良いことを示している。
　推定された交差価格弾力性はだいたい負だったが(つまりカテゴリ間には相補性があったが)、案外小さかった由。先生、もうちょっと別のカテゴリでご研究なさったほうが面白いんじゃないですかね。
　こういうモデルを組まずに、2^(カテゴリ数)の組み合わせに対するバスケットの経験分布をカテゴリ間が独立だったときに期待される分布と比べることを、affinity analysisというのだそうだ(wikipediaにも載っていた。やれやれ)。そういう視点から上記データを分析すると、2カテゴリ併買のバスケットが期待より少ない、つまりカテゴリ間には代替性がある、という知見が得られてしまう。これはマーケティングミクス変数や消費者異質性を無視したせいで生じる誤りだ、云々。なるほど。

　分析例では全カテゴリについて同時にML推定しているようで、どうみてもスケーラビリティがなさそうな話だなあと思ったのだが、著者いわく、カテゴリ数が多くなったらば、まず個々のカテゴリについて推定し、それからMCMCで全バスケットの分布を推定すればよろしいんじゃないですか、とのこと。ふうん...？
　ところで、購買におけるカテゴリ間関係についての説明には、この論文のようなモデル(著者らは大域的効用モデルと呼んでいる)のほかに、店舗選択モデルというのもある由。なるほど、「カテゴリXとYが同じバスケットに入りやすい」という関連性は、その時々の店舗選択によって生じるartifactという面もあるだろう。先行研究として、大域的効用モデルではHarlam&Lodish(1995,JMR), Erdem(1998,JMR), Marchanda et al.(1999)、店舗選択モデルではBell & Lattin(1998, Marketing Sci.)というのが挙げられている。

　これまでに読んだ論文を比べてみると，どれもよく似ている。いずれも、複数カテゴリのバスケット分析を目的とし、世帯レベルの購買データに、ある買い物における複数カテゴリの購買有無を従属変数群、世帯変数とマーケティングミクス変数を独立変数群にとった多変量回帰モデルをあてはめている。ちがいは、

	Marchanda et al. (1999)	Russell & Peterson (2000)	Chib et al. (2002)	Boztug & Hildebrandt (2005)	感想
カテゴリ間の相補性・代替性をモデルでどう表現するか	他カテゴリのマーケティングミクス変数を独立変数にし、さらに残差共分散を自由推定	他カテゴリの購買有無を直接に独立変数にする	残差共分散を自由推定	他カテゴリの購買有無を直接に独立変数にする	モデルに入れちゃうのと、誤差扱いするのと、どっちがいいんだろうか?
バスケットサイズの扱い		当該世帯の平均購入点数を独立変数にする		当該の買い物における購入点数を独立変数にする	Boztug方式は許されるのか?
マーケティングミクス変数の効果の異質性	ランダム係数にし、デモグラ特性で階層回帰	無視	ランダム係数にしている	無視
二値データへのリンク	probit	logit	probit	logit	ランダム係数があったらprobit, なかったらlogitってことだろうか。それとも、残差共分散を推定したかったらprobit、そうでなかったらlogitということだろうか。よくわからない
論文の印象	態度がデカい	妙にくどい	難しいけど親切	謙虚	先生ならChibさんたち、友達ならBuztugさんたちがいいなあ

論文：マーケティング - 読了：Russell&Petersen(2000) 複数カテゴリ購買の確率モデル・最終章

読書日記

読んだ本を淡々と記録します

2012年3月30日 (金)