読了: Esteban-Bravo, Vidal-Sanz, Yildirim (2017) マーケティング活動と売上の時系列を同時にモデル化する、期待値だけじゃなくてボラティリティも

Esteban-Bravo, M., Vidal-Sanz, J.M., Yildirim, G. (2017) Can Retail Sales Volatility be Curbed Through Marketing Actions? Marketing Science, 36(2), 161-323.

 仕事の都合で読んだ。
 一種の市場反応モデル(いわゆるマーケティング・ミックス・モデル)なんだけど、通常の動的回帰モデルではなくベクトル自己回帰モデル(VARモデル)を使い、期待値だけでなくボラティリティ(変動性)もモデル化するという話。

イントロダクション
 ふつう市場反応モデルは売上の条件付き平均に注目し、売上の条件付き分散(ボラティリティ)は一定と仮定する。
 しかし、たとえば価格販促はボラティリティを増大させるだろう。売上のボラティリティが時変する原因として以下がある: (1)顧客の購買行動の異質性が時変する(たとえば顧客間の学習の差のせいで), (2)衝動購買, (3)流通の過程が長いと需要のボラティリティが増大する(bullwhip効果)。
 売上とマーケティングミックスとの条件付き共分散(コボラティリティ)も時変する。たとえば、販促のせいでロイヤルティが下がり購買パターンが不規則になってブランドの売上が不安定になるとか。
 ボラティリティとコボラティリティはマーケターにとって重要だ。ボラティリティを高く見積もると(実際のボラティリティは条件つきでない分散より小さい)、在庫が過剰になる。ボラティリティを小さく見積もると品切れが生じる。売上とマーケティングミックス変数とのコボラティリティが高くなっていることがわかれば、その変数について施策を打とうかという話になる。

 本研究では、マーケティング活動が売上の平均とボラティリティ・コボラティリティに与える影響を調べます。
 本研究の貢献: (1)VAR-BEKKモデル(後述)によってマーケティング・ミックスと条件付き平均・ボラティリティを関連づけます。(2)繰り越し効果を捉えるために、平均のインパルス応答関数(MIRF)とボラティリティのインパルス応答関数(VIRF)を定義したり、平均とボラティリティについてのグレンジャー因果性検定を考えたりします。

文献レビュー
 マーケティングでボラティリティに注目した人は少ない。

  • Raju(1992 Mktg.Sci.): 値引きの程度と頻度がカテゴリ売上の分散に与える効果。指標は25週をウィンドウにとったときの最小売上からの平均偏差。
  • Tuli, et al.(2010 JMR): 顧客とのtieのタイプがサプライヤーの売上成長と売上ボラタリティに与える効果。指標は3期をウィンドウにとったlog(CV)。
  • Vakratsas(2008, EuroJ.OR): マーケティングミックス活動がシェアのボラティリティに与える効果。EGARCHモデル。
  • Fischer, et al.(2015 MgmtSci): マーケティング活動がキャッシュフローに与える効果。指標はhistoricalボラティリティ。

 いっぽう俺らは多変量時系列分析やります。売上と価格・プロモーションとの間の因果的方向は決め打ちしません。

概念的枠組み
 長さ\(d\)の確率変数ベクトル\(X_t\)を考える。売上とかマーケティングミックス変数とかが入ってて、もし必要なら対数変換なんかもしてあるとしよう。定常時系列過程に従っているとする。平均と共分散を$$\mu = E[X_t]$$ $$H = E[(X_t – \mu)(X_t – \mu)^\top]$$とする。条件付き平均と条件付き共分散(ボラティリティ行列)を$$\mu_t = E[X_t | X_{t-1}, X_{t-2}, \ldots]$$ $$H_t = E[(X_t – \mu)(X_t – \mu)^\top | X_{t-1}, X_{t-2}, \ldots]$$とする。対角要素がボラティリティ、非対角要素がコボラティリティである。たいていの場合は\(H_t\)は常に\(H\)と考えるわけだ(conditional homoskedasticity)。
 \(X_t = \mu_t + u_t\)と書こう。以下ではVAR(r)モデル$$ X_t = c + \Pi_1 X_{t-1} + \cdots + \Pi_r X_{t-r} + u_t$$を仮定する。

 準備として、対称行列\(M\)の半ベクトル化変換、つまり下三角行列を縦に並べる変換を\(vech(M)\)とする。
 さて、ボラティリティの時間変動について考えよう。\(h_t = vech(H_t)\)について、多変量ボラティリティモデル$$ h_t = w + \sum_j^q A_j \cdot vech(u_{t-j}u_{t-j}^\top) + \sum_j^p B_j h_{t-j} $$を考える。[えーと、ある時点でのボラタリティ・コボラタリティは、その前期までの当該の(コ)ボラタリティの重み付き線形和と、その前期までの撹乱項由来の(コ)ボラタリティの重み付き線形和だ、というモデルですね]
 ここで、\(H_t\)が常に正定であるようにするには\(A_j, B_j\)に制約をかけないといけない。いろいろ提案があるんだけど、もっともうまくいってるのがBaba, Engle, Kraft, Kroner(1991)とEngle & Kroner (1995)だ。以下では頭文字をとってBEKKと略記する。[これは著者らの造語じゃなくて、ほんとにBEKKモデルと呼ばれているらしく、RにはmgarchBEKKとかBayesBEKKというパッケージがある。第一著者のYoshi Babaとは、おそらく馬場善久さんという計量経済学者じゃないかと思う。おおと、創価大学の学長だそうだ。若き日々のご研究なんでしょうね]

 そういうわけで、\(\mu_t\)についてはVAR(p)モデル, \(h_t\)についてはBEKKモデルを考えます。たとえばVAR(1), BEKK(1,1,1)だとすると $$ \mu_t = c + \Pi \mu_{t-1} + \Pi u_{t-1}$$ $$ h_t = w + B h_{t-1} + A \cdot vech(u_{t-1} u_{t-1}^\top)$$ と書ける[一本目は\(\mu_t = c + \Pi X_{t-1} \)に \(X_{t-1} = \mu_{t-1} + u_{t-1}\)を代入している。二本目の式がBEKK(1,1,1)と表現されているのはなぜだろう? 次数は\(p\)と\(q\)のふたつだと思うんだけど。appendixに書いてあるのかな]。

 さて、このモデルが推定できたとするじゃないですか。そしたら、ショック\(u_t\)の将来への効果を理解できる。観察された最終期を\(T\)として、\((\mu_T, h_T, \hat{u}_T)\)からスタートする。\(u_{T+1}\)を0として\(\mu_{T+1}\)を予測し、\(vech(u_t u_t^\top)\)の未知要素を\(h_T\)で埋めて\(h_{T+1}\)を予測する。これをどんどん繰り返していけばよい。
 ここでいちいち\(H_t\)を使う(\(H\)じゃなくて)のが大事。なぜなら

  • 技術的理由。あやまってconditional homoskedasticityを仮定すると\(\mu_t\)についての仮説検定がおかしくなる。
  • 実務的な理由。\(H = E[H_t] + Var[\mu_t]\)より\(H-E[H_t] \geq 0\)であるから、ふつうは在庫を多めにする羽目になるし、たまに\(H – H_t < 0\)になるような場面では、安全のための在庫がむしろ少なすぎることになる。いいかえるとですね、リスクを5%, 標準正規分布上の95%分位点を\(\Phi^{-1}(0.95)\)として、\(\mu_{ij} + \Phi^{-1}(0.95) \sqrt{H_{ii,t}}\)だけ在庫しなさいってことです。\(\sqrt{H_{ii}}\)じゃなくて。

 今度はマーケティングミックス変数との関係について。
 \(\mu_t, h_t\)のモデルが推定できたら、任意の変数ペアについての同時相関を求めることができる。$$ \rho_{ij,t} = Corr[X_{it}, X_{jk} | X_{t-1}, \ldots] = H_{ij,t} / \sqrt{H_{ii,t} H_{jj,j}} $$ [えええ?VARモデルでパラメータ求めてんのにわざわざ相関を求め直すの? 何考えてんの? と面食らったが、VARモデルには同時相関を表すパラメータはないですね、すいません]
 \(X_{it}\)が売上で\(X_{jt}\)がプロモーションなら、プロモーションは\(\rho_{ij,t}\)が高いときに打つのがよい。\(\rho_{ij,t}\)は因果性の証拠にはならないけど、すくなくとも\(\rho_{ij,t}\)が0に近いときにはプロモーションは効かないはずだ。

 繰り越し効果も考えたいから、\(u_{j,T}\)のショックが\(X_{i,T+l}\)に与える影響を表すインパルス応答関数(IRF)を考えよう。
 マーケターはみんな古典的なIRFが好きだが[どこの国の話でしょうか…]、ボラティリティが時変するときIRFは非線形になり古典的IRFでは表現できなくなる。そこで我々はこのたび、\(u_{j,T}\)の単位ショックが\(\mu_{i,T+l}\)に及ぼす影響を表すIRFと、\(H_{ii,T+l}\)に及ぼす影響を表すIRFを開発しました。それぞれMIRF, VIRFと呼ぶ。Appendixを読みなさい。[いやです]
 MIRF, VIRFはマーケティングミックス変数が売上に与えるインパクトの評価にも使えるが、売上がマーケティングミックス変数に与える評価にも使える。モデルに複数ブランドを叩き込んでおけば競争分析にも使える。
 我々のアプローチではなく、売上についての単変量のARMA-GARCHモデルを組んでいたらこうはいきません。過去の売上のインパクトしか評価できない。
 コボラタリティIRFというのも開発しました。\(H_t\)の非対角要素へのインパクトを評価できます。
 2つの変数に同時に単位ショックを与えたときのIRFも開発しました。
 […中略…]
 MIRFとVIRFの有意性を調べるために、conditional heteroskedasticityの下でのグレンジャー因果性検定と条件付き独立性検定を作りました。たとえば、\(X_t\)を売上\(X_{1t}\)と他の変数\(X_{2t}\)に分けたとき、グレンジャー因果性の観点から\(X_{2t}\)が外生的だとわかったら、もうVAR-BEKKモデルはやめてボラティリティつきの伝達関数モデルを推定すればよろしい。\(X_{1t}\)と\(X_{2t}\)がブロック独立ならそれぞれについて推定すればよろしい。でもそういうことはあまりないだろう。

実証的適用
 おまちかね、実データへの適用です。
 シカゴの大手食品小売店Dominick’s Finer Foods[いまはなくなってしまったらしい]のデータを使う。約8年間、FMCGの29カテゴリの商品について、週次の売上、実売価格、販促有無、小売マージン、トラフィックのデータがある。チーズなど、大手ブランドが寡占している6カテゴリを使う。店舗は潰して集計。価格・プロモーションは平均とする。大手ブランドのみ分析。

 [以下、実務家向けの啓蒙を意図しているらしく、分析プロセスを丁寧に説明している。適当に端折ってメモする]
 観察の上、全変数を対数差分系列にした。季節性はあるけど定常っぽい。
 共和分検定の結果、どのカテゴリでも共和分はなさそうだった(もっとも通常の単位根検定や共和分検定はconditional heteroskedasticityを無視してるけどね)。切片なしのVAR(1)モデル$$\mu_t = \Pi X_{t-1}$$を組むことにした。OLS推定して残差\(\hat{u}_t = X_t – \hat{\Pi} X_{t-1} \)を調べたら、ちょっぴり自己相関があったけど、無視します。[正直だ]
 ボラティリティが時変しているか、\(\hat{u}\)の各要素について、二乗のADF,PACFを描いたりARCH検定をやったりして調べた。やはり時変してまして、ボラティリティとコボラティリティの関連がありました。BEKK(1,1,1)モデルを組むことにします。
 BEKKモデルのパラメータベクトルを、条件付き擬似尤度最大化によって推定。これは一致性はあるけど有効性はない(VARモデルのOLS推定量に有効性がないから)。
 VARモデルとBEKKモデルのパラメータを縦に積んだベクトルについて、初期値を上の推定値として、対数尤度関数[式省略]を最大化します。
 残差を検討します…[略]

 結果。紙面の都合上、ジュースカテゴリのミニッツ・メイドとトロピカーナ(首位)について紹介します[…以下、延々と記述が続く。めんどくさいので読み飛ばした。後半はちょっと面白そうだったので以下にメモしておく]

 マーケティング介入の計画立案について。
 例として、あるブランドの売り上げ\(X_{it}\)と販促\(X_{jt}\)だけについて考えよう。

  • マーケターが履歴データにおいて暗黙的に存在する「ふだんのビジネス」慣性に従う場合、販促\(X_{jt} = \mu_{jt} + u_{jt}, \ u_{jt} \approx N(0, H_{jj,t})\)を実行し、売上\(X_{it} = \mu_{it} + u_{it}\)を得るだろう。\(u_{it}\)は\(u_{jt}\)の下で条件付き正規だ。
  • マーケターが毎期\(\rho_{ij,t}\)を求め、それがある閾値を超えているときに販促を増やすとしたらどうなるか。もはやマーケターは\(u_{jt} \approx N(0, H_{jj,t})\)ではなく、決定的な値\(x > 0\)について\(\tilde{u}_{jt} = u_{jt} + x\)を実装しているわけだ。\(u_{it}\)は\(\tilde{u}_{jt}\)の下で条件付き正規となる。

 トロピカーナのVAR-BEKKモデルによって二人のマーケターをシミュレーションしてみよう。[…細かい話が続く。読み飛ばした…] ご覧のように、後者のマーケターのほうが売上が高い。

 これらの戦略には、消費者が\(x\)への介入に参加していないという仮定が含まれている。さもないとVAR-BEKKルール全体が変わる(これがいわゆるルーカス批判である)。もっとも我々のデータの場合には、複数店舗を潰して分析しているし、消費者が小売チェーン全体の戦略を追跡できるとは思えないので、あまり心配ない。

結論
 本研究の目的は経験的一般化の確立ではない。すべての製品の売上がボラティリティを持つと主張する気も無い。また、月次とか四半期とか年次のデータはボラティリティを持ちにくいだろう。いいたいのは、高頻度のデータをみるとき、マーケターはボラティリティに直面することがあり、それを無視してはいけないということだ。
 本研究の目的は、売上のボラティリティと最適マーケティングミックスの関係に注意を向け、売上反応モデルの研究に貢献することだ。アジェンダを設定しただけで、限界も今後の拡張もいろいろある。appendixをみてくれ。[ええええ、そういうのも付録に回すの?]
 本研究の手法はbullwhip効果の平滑化にも使える。[… 略]
警告。ボラティリティはマーケターにとってパワフルな指標となるが、それをリスクと取り違えてはいけない。ボラティリティ以外のリスクもある。構造変化とか外れ値とか。また、ボラティリティは分布の非対称性を考慮に入れていない。ボラティリティについて考慮することはリスク管理の一部だが、本研究は広い意味でのリスクの研究ではなく、単に現象が持つ規則的な変動の程度の変化を測定・制御しようという話である。
 云々。
——————
 全然知らない方向の話で、とても勉強になりましたです。ボラティリティなんて株とかの話かと思ってたけど、マーケティングにも出てくるのね。

 この論文、すごく難しいことをやっているけど、要するにマーケティング・ミックス変数の売上への因果効果を推定するのはあきらめて、繰越効果を含めた相関を正しく求めることに徹しましょう、という方向の話だと思う。それはそれで納得がいくんだけど、売上の期待値・分散を目的変数、マーケティングミックス変数を説明変数にとったモデルで正面から効果推定を目指す路線とどっちが優れているんだろうか。
 市場反応モデルの文脈でいうと、著者が言うように売上のボラティリティの変動に注目することは確かにあまりないと思うけど、マーケティングミックス変数の偏回帰係数を時変させるモデルなら、偏回帰係数を状態とした状態空間モデルとして比較的容易に組めますよね。著者らは「あるマーケティングミックス変数と売上のコボラタリティが高いときにその変数を高める活動をする」という指針を提案しているが、「変数の偏回帰係数が高いときに活動する」という指針のほうが筋が通ってないっすか? また、ボラティリティが時変するってんなら、ついでに撹乱項の分散も状態変数とし、その状態変数を自己回帰させたりマーケティングミックス変数に回帰したりする方がわかりやすくないっすか?
 … あっそうか、それが著者らのいう「ボラタリティ付きの伝達関数モデル」か。著者らの考え方だと、マーケティングミックス変数が外生的ならどうぞ売上を目的変数にとったモデルを組みなさい、でもまずはVAR-BEKKモデルを組んでグレンジャー因果性検定で外生性を確認してみなさい、ってことなんだろうな。いいかえると、著者らの提案するMIRF/VIRFが活躍するのはマーケティングミックス変数の内生性が否定できないときに限られ、しかし著者らはたいていの場合はマーケティングミックス変数の内生性を否定できないと考えている、ということなのだろう。うーん、それはまあ、そうかもしれない。辛いなあ。