« 読了:Castro(2002) 階層的データの分析手法対決 | メイン | 読了:「星屑ニーナ」「ハチワンダイバー」 »
2011年12月22日 (木)
Manchanda, P., Ansari, A., Gupta, S. (1999) The "Shopping Basket": A model for multicategory purchase incidence decisions. Marketing Science, 18(2), 95-114.
複数カテゴリの購買を一気に説明する統計モデル。仕事の都合で読んだ。
世帯 h がある買い物 t においてカテゴリ j を買ったかどうかを表す二値変数を y_{hjt}, その背後にある効用を u_{hjt} とし (分散を1,閾値を0とする)、
u_{hjt} = \beta_{hj0} + \beta_{hj1} (own effects) + \beta_{hj2} (cross effects) + \epsilon_{hjt}
とする。own effectsはカテゴリ j のマーケティングミクス変数, cross effectsは他のカテゴリのマーケティングミクス変数。誤差項のベクトルは多変量正規分布に従うものとする (\epsilon_{ht} ~ MVN[0, \Sigma])。要するに、各カテゴリの購買をマーケティング変数で説明する多変量プロビットモデルをつくり、cross effectsと残差共分散行列の両方でカテゴリ間の関係を表そうという作戦である。著者らはカテゴリ間でマーケティング変数のcross effectsがあることをcomplementarity, 残差相関があることをco-incidenceと呼んでいる。前者は販促に、後者は売り場配置に役立つでしょうとのこと。
次に、世帯レベルのパラメータベクトル \beta_h = {\beta_{h0}, \beta_{h1}, \beta_{h2}}について
\beta_h = (デモグラ変数) \mu + \lambda_h
とする。で、\lambda_h ~ MVN[0, \Lambda] とする。えーと、要するに2段目のランダム回帰係数を1段目で説明する階層回帰モデルだ。
これをMCMCで推定する。事前分布として\muにはMVN, \Lambdaには逆ウィシャート分布を与える。\Sigmaの事前分布の話とMCMCの具体的な手続の説明は難しくてよくわからなかった。まあいいや。
分析例は、洗濯洗剤、柔軟剤、ケーキミックス、ケーキフロスティングの4カテゴリの購買データ。たぶんホームスキャンパネルデータだと思う。えーと、ただいま調べたところ、フロスティングってはケーキの表面に塗る甘い奴のことらしい。俺はあまり好きじゃないが、アメリカ人は好きそうですね、あれ。マーケティング変数としては価格と販促有無を使っているのだが、実際の推定時には販促有無に対する係数はh,tを通じて等値にしてしまっている。デモグラ変数は世帯人数と買い物回数。もっとシンプルなモデル(complementarityやco-incidenceを抜いたモデル)と比べて、ホールドアウト・データに対する予測が優れている由。
Marketing Science誌というのは,心理学でいうところのJEP:Generalのような,日本人が一度載せたら人生変わっちゃうような超一流誌だろうと思うのだが、たまにこの雑誌の論文を読んでいると、不思議の国に迷い込んだような気がすることがある。
この論文の場合でいえば、正直なところどこがどうすごいのか、素人の俺にはよくわからなかった。問題は新しくないと思うし、モデリングの発想は比較的に素直なものだと思うし、分析例はたった4カテゴリで実用性に乏しいし、どんどんスケールアウトできるモデルでもなさそうだし、いろいろごちゃごちゃ言い訳も多いし。。。俺が理解していないだけで、数理技術的にすごいのだろうか? それともこの論文の時点では、そもそも階層モデルのMCMC推定自体が新しかったのだろうか?
もうひとつ疑問なのは、結局このモデルはカテゴリ間に観察された購買共起関係をマーケティング変数の交差効果と残差相関に分解しているわけだけど,その分解がどれだけロバストなのか、という点。分解のしかたが違うのに同じような予測を返す複数のモデルが作れるはずで、だからホールドアウトに対する予測の良さは証拠にならないと思う。交差妥当化をやっていれば納得したけれども。直感的には、ML推定では絶対identifyできないモデルを最新技術で無理矢理推定しといて、そのパラメータを実質的に解釈するという点が気色悪い。事前分布次第でどうとでもなるんじゃないかと。
だいたいですね、本文15頁の論文にアブストラクトが丸々1頁あるってのはどういうことかと。要約という概念を打ち砕くつもりか。縦読みすると真の要旨が浮かび上がるとか? そんなこんなで、頭にいっぱいハテナマークを浮かべながら読了。
論文:マーケティング - 読了:Manchanda et al. (1999) 複数カテゴリ購買生起モデル