elsur.jpn.org >

« 読了: 久野 (2009) ベティ・クロッカーさんの変遷 | メイン | 読了:「二人の巨匠」「東京喰種」「すみれファンファーレ」「暗殺教室」「おにぎり通信」 »

2013年6月14日 (金)

Jain, D.C. & Vilcassim, N.J. (1991) Investigating household purchase timing decision: A conditional hazard function approach. Marketing Science, 10(1), 1-23.
 世帯の購買記録に生存モデル(比例ハザードモデル)をあてはめた古典的研究としてよく引用されている論文。めんどくさそうで腰が引けていたのだが、これだけ引用されているんだから仕方ない、と覚悟して読んだ。

 まず、ベースライン・ハザード関数 $h_0(t)$ をすごく一般的に、次のように定式化する:
 $\displaystyle h_0(t) = \exp \left( \gamma_0 + \sum_{k=1}^K \gamma_k \frac{t^\lambda_k - 1}{\lambda_k} \right)$
うんざりして投げ出しそうになったが... イベント間隔時間 $t$ を パラメータ $\lambda_1, \lambda_2, \ldots$でそれぞれBox-Cox変換し、重み $\gamma_1, \gamma_2, \ldots$ をつけて足しあげている。なんでこんなケッタイなことをしているのかというと、過去に用いられてきたいろいろな確率分布を一発で表したいからである。たとえば、$\gamma$ をすべて 0 にすれば、ベースライン・ハザードは定数、確率分布は指数分布となる。$\gamma_1$だけ残して残りを0にし、 $\lambda_1$を十分に小さくすれば、ワイブル分布。この調子で、ゴンペルツ分布、Erlang-2分布もいけるとのこと。しらんがな。
 このベースライン・ハザードに、カレンダー時間$\tau$に依存する共変量 $X_1(\tau), X_2(\tau), \ldots$ の効果 $\exp( \sum_j X_j (\tau) \beta_j )$ と、世帯間異質性 $\exp( c \theta )$を掛けてハザード関数にする。$\theta$ は世帯間でのみ動く確率変数。
 推定方法は飛ばし読み。異質性の推定に関しては、例によってHeckman-Singer のサポート・ポイントという考え方が出てくる。でたな経済学者め。こうなったら意地でも勉強してやるもんか。きっと潜在クラスみたいなものにちがいない。

 データはIRIの世帯購買記録 (マーケティング変数つきのスキャンパネルデータであろう)。カテゴリは粉コーヒーとインスタント・コーヒー。それぞれ、結構買っている166世帯, 427世帯について分析する。共変量は、ディスプレイ、チラシ、メーカーのクーポン、店舗クーポン、値引き、前回購買のボリューム(買い置き有無の代理指標として)、世帯人数、夫の雇用。70日まで推定する。
 結果は... 異質性の項をいれるといれないではベースラインハザードの形状が変わる。いずれにしろ非単調。指数もワイブルもゴンペルツも二次もErlang2もうまくフィットせず、ノンパラに推定するのが良い。云々。途中から死ぬほどめんどくさくなって、ぱらぱらめくっただけ。

 前に読んだSeetharaman&Chintagunta(2003) に照らして考えると、そもそもスーパーでのカテゴリ購買間隔について日次をメトリックにした生存モデルをつくって良いのかどうかが怪しい、といえるだろう。ある日にカテゴリ購買が起きていないのは、スーパーに行かなかったからかもしれないし、行ったけど買わなかったからかもしれない。ずいぶん意味合いがちがう。
 素朴すぎる疑問かもしれないけど... この論文の先行研究概観をみると、EhrenbergのNBDを使った集計レベルモデル(なんと1959年)にはじまり、たいていの研究が購買間隔に一定の確率分布をあてはめようと試みている。でも、マーケティング・ミクス変数の効果を推定するということが主目的ならば、Cox回帰でもって、ベースライン・ハザード自体を推定することなしに共変量の効果を推定したほうがスマートだ。なぜこの分野では最初からそういう話にならなかったのだろうか? Cox回帰自体の歴史はかなり古いはずなのに...
 などといいつつ、ほんとに適当にめくって済ませた論文であった。ここ数ヶ月、寝ても覚めても生存モデルについて考えているので、少々飽きてきた、という面もある。

論文:データ解析(-2014) - 読了: Jain & Vilcassim (1991) 購買タイミングの比例ハザードモデル (クラシカル・バージョン)