読了: Chandukala, Dodson, & Liu (2017) 製品サンプル配布の効果を観察データから推測する

Chandukala, S.R., Dodson, J.P., Liu, Q. (2017) An Assessment of When, Where and Under What Conditions In-Store Sampling is Most Effective. Journal of Retailing, 93(4), 493-506.

 仕事の都合で読んだ奴。店頭での製品サンプル配布が売上に及ぼす影響をモデル化して既存データからパラメータを推測するという話。
 Google様いわく、被引用件数18件。す、少ねえ…

1. イントロダクション
 メーカーはよく店頭販促の一環として無料サンプルを配る。売上への効果は広告などより大きいといわれている。クーポンなどとちがい、マージンを減らしたり消費者の価格期待を変えてしまったりすることがない。小売の側からみると買物経験の拡張が期待できる。
 過去のサンプリング研究は家庭への配布に偏っていた。Bawa & Shoemaker (2004 MktgSci.), Gadenk & Neslin (1999 J.Retailing), Rothschild & Gaidis(1981 J.Mktg)をみよ。店頭配布の研究はせいぜい Heilman, Lakishyk & Radas(2021 British Food J.), Lammers(1991 J.ConsumerMktg.)くらいだ。[←あるじゃん…]
 店頭サンプリングについてはその効果の時間発展がわかっていない。さらに、(1)反復によってなにが起きるのか、(2)ただの店頭陳列とどうちがうのか、(3)サンプル受領の結果としてのリピート購買はその店でなされるとは限らないわけで、どういう競争環境下にあるどういう店舗がやればよいのか、を知りたい。

 というわけで、店頭サンプリングの短期効果と繰越効果を捉えるモデルを組みます[いろいろ能書きが書いてあるけど、予告編にあたる箇所なのでメモ省略]。データにあてはめて、店頭陳列と比べます。
 [結果についての予告編が1パラグラフ。メモ省略]

2. 理論的モチベーション
 店頭サンプリングは短期売上の増大につながるといわれている(Lammers, 1991; Shi, Cheung, & Predergast, 2005 J.Adv.)。
 店頭サンプリングは他の販促よりも効くといわれている(Jain, Mahajan, & Muller, 1995 JPIM)。その理由のひとつは製品使用経験である(Fazio & Zanna 1978 J.Personality; Hoch 2002 JCR; Smith & Swinyard, 1988 J.Adv.)。さらに販売員との直接接触による付加情報提供も考えられる(Levin & Gaeth 1988 JCR; Kempf & Smith, 1998 JMR; Wright & Lynch, 1995 JCR)。
 経験が効くという話はセンサリー・マーケティングの分野でもあって…[メモ省略]
 製品サンプリングは互酬性という観点からも魅力的である。Laochumnanvanit, krogjit, Bednall (2005, J.Acad.Mktg.Sci.)をみよ。[←おお… この発想はなかった]
 最後に、広告の研究では反復に効果があるという話がある(Vakratsas & Ambler, 1999 J.Mktg.)。

 まとめると… これらの理論は、店頭サンプリングに短期効果と繰越効果の両方があることを示唆している。
 我々の研究は店頭サンプリングの理解における3つの重要な側面に焦点を当てる。(1)短期効果と繰り越し効果。(2)メーカーからみた効果と小売からみた効果。(3)店頭陳列との比較。

3. モデル構築
 製品\(j\)の店舗\(s\)での時期\(t\)の売上を$$ y_{jst} = x_{jst} \eta_{js} + \sum_m \tau_{mjs} \lambda_{mjst} I_{mjst} + \varepsilon_{jst}$$ とする。\(x_{jst}\)は価格とか季節性とかトレンドとかの制御変数で、先頭は\(1\)とする。
 \(m\)はサンプリング・イベントのインデクス。\(\tau_{mjs}\)はその効果、\(\lambda_{mjst}\)は時変する効果。\(I_{mjst}\)は店頭サンプリングが起きていることを示すインジケータで、そのイベントがある週で1になり、その後52週にわたってずっと1である。[へー。ふつうその週だけ1にしておいて \(\sum_{k=0}^{52} \beta_k I_{t-k}\)という風にラグで表現すると思うんだけど、そう書きたくない理由があるんだろうな]

 繰越効果はガンマ密度分布で表現する。$$ \lambda_{mjst} = \frac{\iota_{mjst}^{k_j-1} \exp(-\iota_{mjst} \beta^{-1}_j)}{\Gamma(\kappa_j) \beta_j^{\kappa_j}} $$ \(\iota_{mjst}\)は、サンプリングイベントのあいだ1となり、その翌週以降2, 3, … となる。
 [わかりにくいのでおさらいしておくと、ガンマ分布の確率密度関数は、形状を\(k \gt 0\), スケールを\(\theta \gt 0\)として$$ f(x) = \frac{x^{k-1} \exp(-x/\theta)}{\Gamma(k) \theta^k}$$ である。ここでは形状が\(\kappa_j\)、スケールが\(\beta_j\)になっているわけね。繰越効果の形状は製品で決まると考えていることになる。
 要するに、横軸に「サンプリングから何週過ぎたか」、横軸にそのサンプリングによる売上の増分をとったとき、単調減少も山形も表せるような柔軟な関数にしたいというモチベーションがあるわけだ。このメモはライブでとっているので、この先を読むとまた違う感想になるのかもしれないけれど、正直いってモデルを柔軟にしすぎじゃないかという疑問がある。気持ちはわかりますよ? 受領者はサンプルを使う前にリピート購買するかもしれないし、使い切ってからリピート購買するのかもしれない。でもさ、そんならもっと実質的なモデルを組んだほうがよくないですか? 即時効果と繰越効果の項を分けて、前者は幾何級数型分布ラグモデル、後者はその財の平均使用日数がモードになるような山形だと決め打ちする、とかさ。こうして柔軟なモデルを組んで記述に徹するのだとしても、ガンマ密度関数って凝りすぎじゃないですか? 素直にNBDラグにしたらあかんの? あれだってパラメータは2つよ?
 もっとも、なにかガンマ密度関数を使うことにご利益があるのかもしれない。実は推定しやすいとか? 先行研究としてAribarg & Arora (2008 JMR)というのが挙げられている]

 \(\lambda_{mjst}\)について、\(\int \lambda_{mjst} d \iota = 1\)と制約する。\(\tau_{mjs}\)はトータルの売上増分と解釈できる。さらに、$$ \tau_{mjs} = \tau_{0js} + C_{mjs} \gamma $$ とする。\(C_{mjs}\)には、前にサンプリングやったことがあるかとか、前のサンプリングから何週経っているかとかを入れる。イベントが少なくて\(\gamma\)を推定できない場合は、しょうがないので\(\tau_{mjs} = \tau_{0js}\)とする。
 [あー、これは面白いね。一種の階層モデルを組んで、個々のサンプリング・イベントの効果を{製品, 店舗, イベント}の特性で説明するわけだ。自分の仕事の場合でいうと、実務家は個々の販促活動についてデータ化されていないいろんな知識を持っていて、個別の活動の効果推定値をその知識とともに解釈したいと考えるので、モデルのなかに販促活動の特性を組み込むのはやりすぎになってしまう。でもこういうモデルにも実務的な示唆があるのは確かだ]

 どこで店頭サンプリングをやるか、という店舗選択に内生性があるかもしれない。そこで、店舗でサンプリングが生じる確率をロジット関数でモデル化する。$$ Prob(max_t I_{mjst} = 1) = \frac{\exp(\alpha_{1j} + \alpha_{2j} \tau_{0js})}{1 + \exp(\alpha_{1j} + \alpha_{2j} \tau_{0js})} $$ \(\alpha_{2j}\)が0より大きかったら、期待される売上増大が大きい店舗が選ばれていることになる。
 [いやいやいや… メーカーも小売も店頭サンプリングの効果を実施前に知ることはできないだろうから、これはちょっと無理のあるモデルだと思うけど??? 内生性バイアスを取り除くためだけであれば、こういうやりかたでもOKなのだろうか…]

 店舗による異質性を説明するため、階層モデルを組む。\(\eta_s = (\eta_{1s}, \ldots, \eta_{Js}), \tau_{0s} = (\tau_{01s}, \ldots, \tau_{0Js})\)とし、縦に積んで\( \eta^*_s = (\eta_s, \tau_{0s}) \)として、$$ \eta^*_s \sim MVN(Z_s \delta, D_{\eta^*}) $$ とする。\(Z_s\)に店舗特性をいれる。[えーっと、\(\eta_s\)は長さ\(2J\)のベクトルだけど、それを店舗特性ベクトル\(Z_s\)に回帰するってことね。その長さを\(l\)として、\(\delta\)は\((l, 2J)\)の行列であろう]

 最後に、それぞれの\(s\)について$$ \varepsilon_{jst} = \phi_j \varepsilon_{js,t-1} + v_{jt} $$ する。つまり時間依存性については定常VAR(1)を考えるわけだ。で、ブランド間依存性を表現するために、\(v_t = (v_{1t}, \ldots, v_{Jt})\)として$$ v_t \sim MVN(0, \Sigma)$$とする。

 [おさらいしよう。ガンマ確率密度関数を\(Gamma(x; k, \theta)\)として、モデルは $$ y_{jst} = x_{jst}\eta_{js} + \sum_m \tau_{mjs} Gamma(\iota_{mjst}; \kappa_j, \beta_j) I_{mjst} + \varepsilon_{jst} $$ $$ \tau_{mjs} = \tau_{0js} + C_{mjs} \gamma$$ $$ Prob(\max_t I_{mjst} = 1) = logit(\alpha_{1j} + \alpha_{2j} \tau_{0js})$$ $$ \varepsilon_{jst} = \phi_j \varepsilon_{js,t-1} + v_{jt} $$ $$ \eta^*_s = (\eta_{1s}, \ldots, \eta_{Js}, \tau_{01s}, \ldots, \tau_{0Js}) \sim MVN(Z_s \delta, D_{\eta^*}) $$ $$ v_t = (v_{1t}, \ldots, v_{Jt}) \sim MVN(0, \Sigma)$$ である。結局、パラメータは、サンプリング効果の製品別ラグ分布パラメータ\(\kappa_j, \beta_j\)、イベントレベルのサンプリング効果をその特性で説明する係数\(\gamma\)、イベント実施確率をイベントの効果で説明する製品別パラメータ\(\alpha_{1j}, \alpha_{2j}\)、撹乱項のVAR成分の製品別パラメータ\(\phi_j\)、製品x店舗レベルのパラメータを店舗特性に回帰する際の係数\(\delta\)とその共分散行列\(D_{\eta^*}\)、イノベーション項の共分散行列\(\Sigma\)、である]

 推定方法はAppendixを参照。[力尽きたので読まなかったけど、もちろんMCMCである]

4. データ
 メーカー側データと小売側データをそれぞれ集めた。
 メーカー側データは5つ。たとえばデータセット1は健康スナックのある新SKYについて、28週39店舗の売上数量、ユニット価格、店舗特性(年間契約額と競合数)、店頭サンプリング日を含んでいる。いずれについても他の販促活動はやってなかった。[読み落としたのかもしれないけど、たぶん店舗当たりサンプリング回数は1回なんだと思う]
 小売り側データは、US東海岸のある大きな食品チェーン店のスキャナーデータ。あるカテゴリの2ブランドのみ。片方のブランドで2年間に8回のサンプリングをやっていた。他の販促活動はやってなかった。

5. 結果
 従属変数は標準化対数売上、制御変数は標準化対数価格、店舗特性は標準化年間契約額と競合数とした。
 メーカー側データ5個にそれぞれモデルをあてはめて、以下がわかった。

  • サンプリングの即時効果は正で有意だが、その強さは製品による。
  • 価格は負に有意。年間契約額とサンプリングの交互作用は5つのうちひとつで負に有意(つまり、小さい店舗のほうが効く)。競合数とサンプリングの交互作用はなし。
  • 一部店舗でのみサンプリングしていたのは5つのうちひとつだけ。内生性パラメータ\(\alpha_2\)は有意でなかった。
  • ガンマ減衰パラメータは1以下。つまり、最初の週にピークがあって、その後急速に減衰し、2~8週しか続かない。[なあんだ]
  • 売上の撹乱項の自己相関は正に有意。

 小売側データのほうでは…[中略]… ガンマ減衰パラメータはとても大きかった。つまり、サンプリングの反復によって減衰は遅くなるようだ。[サンプリング戦略の違いのせいなのか、データセットの違いのせいのか、よくわからんような気がするのだが…]

6. 考察と結論
6.1 サンプリングと店内陳列の効果の比較
 in-store displayの効果についての一般的知見と比べてみよう。[後者のチャートをどうやって描いたのかの説明。省略するけど、別のデータから求めている]
 単一のイベントの場合、サンプリングのほうが即時効果が大きく、繰越効果も大きい。
 反復した場合、陳列のほうの減衰曲線は単に単一より下がるだけだが、サンプリングの減衰はより遅くなる。

6.2 最適店舗選択
 [めんどくさくなってきたのでパス]

6.3 要約と結論
 カテゴリ・マネージャ、ブランド・マネージャのみなさん、本研究の示唆は以下の通りです。

  • 店頭サンプリングは効果的だ。
  • 店頭サンプリングの効果は製品の種類によって異なる。
  • 店頭サンプリングを行う店舗について、競合情報をいれた空間モデルをつくるとよかろう。[これは示唆というより今後の研究課題じゃないですかね? だって競合店舗数は有意じゃなかったんでしょ]
  • 小売側データの分析でわかったことだけど、サンプリングはカテゴリ拡張にもつながる(他のSKUの売上も上がる)。今後の課題だ。

云々。
———-
 うーん… 面白かったし勉強になりましたけど、やっぱり累積レベルデータ分析の限界ってやつを感じましたね。製品サンプル配布の研究で、個人レベルデータと累積レベルデータを併用しているやつとか、パネルデータを使っている奴とか、ないのかしらん。
 上記のメモにも書いたけど、モデルがあんまり実質的理論を伴っていないという点もモヤモヤした。Bawa-Shoemakerモデルみたいに、「製品サンプル配布の効果はA,C,Eの3つに分けられるんです」なんて言われると、おおーって思うんだけどな。
 配布あたり効果が反復によって変動すると主張するならば、反復があるデータとないデータを比べるんじゃなくて、反復が含まれている長期データで活動ごとの効果を推定していくのがスジだと思った。いや、それが難しいというのはわかってるんですけど。