読了:Cain (2010) マーケティング・ミックス・モデルによるマーケティングROI測定

Cain, P.M. (2010) Marketing Mix Modelling and Return on Investment. Kitchen, P.J. (ed.) “Integrated Brand Marketing and Measuring Returns“, Chap.2. Palgrave Macmillan.

 仕事の都合で読んだ。MMMでマーケティング活動の長期・短期ROIを測定するという解説。
 疲れた… 著者の先生と出版社のみなさまには、数式の誤植は潰して下さいとお願いしたい。初学者には大変なハードルとなります。

1.イントロダクション
 マーケティングミックスモデル(MMM)とは…[略]
 MMMはふつう売上数量増大のみに注目するので、短期のROIについてしかわからない。MMMに基づく予算配分は販促に偏りがちである。マーケティング投資の長期的影響を測るにはMMMのベース売上に焦点をあてる必要がある。
 伝統的なOLSでは決定論的なベース売上を考えてしまうので長期的影響を分析できない。動的な共和分VARモデルを使うという手もある。Dekimpe & Hanssen (1999 JMR) を読むべし。しかし完全に特徴づけられたMMMの文脈では往々にして現実的でない[←どういうことだろう?]。
 むしろ、データの長期的特徴と短期的特徴を分離するアプローチのほうが使いやすい。時系列回帰を使うのがよい。理由: (1)すべてのMMMは時間に沿ったデータを使うので、本質的に時系列方程式である。(2)トレンド、季節、偶然誤差を分離できる。
 本章では時系列回帰による長期ROI測定について述べる。

2.モデリングのプロセス
 標準的なMMM構築は(1)-(4)の4ステップからなる。長期ROI推定の場合は最後に(5)が付け加わる。

  • (1)経済学的モデル構造を決める。
  • (2)モデリングの深さとデータ入力を決める。
  • (3)短期モデルの推定。
  • (4)売上を分解し短期ROIを推定。
  • (5)間接的マーケティング効果とトータルROI推定。

ここで注意してほしい点: MMM構築の多くのアプローチはミクロ経済学的な消費者需要構造を無視している。また、標準的なOLS回帰に従いがちで、時系列データの性質に注意を向けないことが多い。
 
2.1 経済学的モデル構造
 次の階層構造を考えよう。下から順に、(1)特定のアイテム・ブランドへの支出, (2)カテゴリ別支出、(3)ビジネスユニット別支出。

 特定のアイテム・ブランドについてのモデルについて。ふつうは需要の単一方程式を使う。製品\(i\)の期\(t\)における売上を\(S_{it}\)として $$ S_{it} = \exp(\alpha_i + T_i + \delta_i + \epsilon_{it}) \prod_j^n \prod_k^M f_m (X_{kit})^{\beta_{ijk}} $$ という感じ。\(T_i\)はトレンド、\(\delta_i\)は季節インデクス、\(X_{kit}\)はマーケティング・経済的な変数で\(f_m\)は乗法的関数。\(\alpha\)がいわゆるベース売上である。[\(T_i, \delta_i\)は\(T_{it}, \delta_{it}\) の誤植では?]
 加法形式で書くと $$ \log S_{it} = \alpha_i + T_i + \delta_i + \sum_j^n \sum_k^M \beta_{ijk} \log X_{kit} + \epsilon_{it}$$[第4項でわざわざインデクス\(j\)を回している理由がわからん。\(\beta_{ik} = \sum_j^n \beta_{ijk}\) として \(\sum_k^M \beta_{ik} \log X_{kit} \) じゃんね? いったいどういうつもりだ? 遅延効果を考えた\( \sum_j^n \sum_k^M \beta_{ijk} \log X_{ki,t-j} \) の誤植か? それとも、競合の活動の効果を考えた \( \sum_j^n \sum_k^M \beta_{ijk} \log X_{kjt} \) の誤植か? ]

 もし焦点が単一の商品だけにあるならこれでいいし、\(\beta_{ijk}\)は需要の弾力性としてわかりやすいからこうすることが多い。しかし、2つの欠点がある。

  • 二重対数関数形式[両側対数形式のことと思う]は慣習的なマクロ経済学的需要理論におけるadding up制約と不整合である。あるカテゴリの複数の製品にこの式をそれぞれ当てはめたとしよう。製品\(i\)の式は、自身のマーケティング・メカニクス(M個)と、そのカテゴリの他のブランドのドライバ(n個)との関数である。競合製品の活動\(X_j\)による売上減少の推定値は、競合の売上増と一致しないかもしれない。それはカテゴリ売上の変化だと解釈する手もあるが、それが本当かどうかはわからない。[あああ… やっぱし誤植があるな… モデル式の中の\(X_{kit}\)はほんとは\(X_{kjt}\)だろう]
  • それぞれのモデルは売上増大をマーケティングミックスの諸要素に振り分けている。しかし、この売り上げ増大が他のブランドから来ているのか、カテゴリ拡大から来ているのかがわからない。

 カテゴリについての同時モデルについて。主要な理論としては次の2つがある。

  • 連続的選択モデル。Stoneの線形支出システム、Rotterdamモデル、Almost Ideal Demand System (AIDS)。[なにそれ、全然知らんわ… 最後の奴についてはCain(2005, IJRM)を読めとのこと]
  • 離散的選択のアプローチ。魅力モデルとか。

 ここでは広く使われている魅力モデルに焦点をあてよう。$$ A_i = \exp(\alpha_i + T_i + \delta_i + \epsilon_i) \prod_j^n \prod_k^M f_m (X_{kit})^{\beta_{ijk}} $$ として[\(T_i, \delta_i, X_{kit}\)はそれぞれ\(T_{it}, \delta_{it}, X_{kjt}\)の誤植だと信じて先に進もう]、シェア\(s_i\)について$$ s_i = \frac{A_i}{\sum_j^n A_j} $$ とする。代入して変形すると、\(p\)番目の製品を選んだとして $$ \log \frac{s_{it}}{s_{pt}} = (\alpha_i – \alpha_p) + (T_i – T_p) + (\delta_i – \delta_p) + \sum_k^M \sum_j^n (\beta_{kij} – \beta_{kpj}) \log X_{kjt} + (\epsilon_i – \epsilon_p) $$
となる。この式が \(n-1\)本できるわけである。
 実際にはデータが足りなかったり共線性があったりするので、もっと制約することが多い。すべての直接交差効果\(\beta_{kij}\)を0とするとか(差分効果モデル)、\(\beta_k\)をブランド間で等しくするとか(定数効果モデル)。
 魅力モデルでは\(p\)としてどのブランドを選んでも推定が不変であることを確認する必要がある(システムを丸ごとML推定すればそうなる)。また、ブランド数量を導出するにはこれとは別にカテゴリ数量\(CV_t\)のモデルが必要になる。 マクロ経済的ドライバーを\(Z_t\)として: $$ \log CV_t = \alpha + T_i + \delta_t + \sum_j^n \sum_k^K \rho_{ij} \log X_{kj} + \sum_L^l \phi_i Z_t + u_t $$[おかしい… 添字が滅茶苦茶だ。勝手に修正させていただくと、 $$ \log CV_t = \alpha + T_t + \delta_t + \sum_j^n \sum_k^K \rho_{kj} \log X_{kj} + \sum_l^L \phi_l Z_{lt} + u_t $$ ではないでしょうか先生]

 ビジネスユニットのモデルについて。企業はカテゴリ(例, 洗剤, 石鹸, …)の上の単位としてビジネスユニット(ヘルス&パーソナルケア)を考えることが多い。個々のカテゴリについてモデル化して積み上げるのは大変なのでビジネスユニットのモデルを作ることもある。その場合はAIDSモデルが便利である。当該ビジネスユニットの全カテゴリの消費者支出を\(TCE_t\)として、$$ S_{BUit} = \alpha + T_i + \sigma_i + \sum_j^n \gamma_{ij} \log p_{jt} + \sum_m^M \sum_j^n \phi_{mij} X_{mt} + \beta_i \log \frac{TCE_t}{\tilde{p}_t} + \epsilon_{it} $$ $$ LnTCE_t = \alpha + T + \delta_i + \sum_j^L \phi_i Z_{lt} + u_t $$ [またまた面妖な数式を平然と載せるね… これ絶対誤植あるじゃん…
 式と式の間で記号がダブることを気にしないとして、2本目は $$ \log TCE_t = \alpha + T_t + \delta_t + \sum_l^L \phi_l Z_{lt} + u_t$$ であろう。\(Z_{lt}\)はマクロ経済指標だ。
 問題は1本目で、なにがなんだかさっぱりである。おそらくビジネスユニットの添字はなくて、\(i\)がメーカー, \(t\)が期、左辺は\(t\)における\(i\)の売上金額シェアだ。第1-3項はおそらく\(\alpha + T_{it} + \sigma_{it}\)が正しい。第4項はおそらくは\(\sum_m^M \sum_j^n \phi_{mij} X_{mit}\)が正しい。問題は第2項と第4項で、\(p_{jt}, \tilde{p}_t\)とはなんなのかがわからない… 本文中にはdeflated total consumers’ expenditureという言い方が出てきているが、それもよくわからない。参ったな… これはここで悩むより、AIDSモデルについて別の資料を探したほうが早そうだ]

 以上、3レベル別のMMMを例示したが、データ累積のレベルとモデル構造は別の問題で、たとえばどのレベルで単一方程式を使ってもよいし(需要システムのミクロ経済的な整合性が失われるだけだ)、需要システムアプローチを製品のグループについて使ってもよい。

2.2 モデリングの深さとデータ入力
 市場レベル時系列の純粋な時系列モデルを使うこともあるけれど、これはもっとも高い抽象レベルであって、クロスセクショナルデータが手に入らない場合の話である。
 キーアカウント・店舗とか地域とかその組み合わせを単位とした集計値が手に入る場合や、(実務では珍しいだろうけど)世帯レベルパネルデータが手に入る場合もある。縦断パネルデータセット、いわゆる時系列クロスセクション(TSCS)モデルである。[おおお… TSCSってマーケティング分野で出てくるの初めて見た。私のイメージだと、パネルデータより時点数が多く個体数が少なく個々の個体に関心があるときの呼び名かと思ってたけど、ここではパネルデータと同じ意味で使われている模様]

 需要ドライバー変数はマーケティングミックス全体を表すように選ぶ。乗法的モデルではメディアの効果の逓減が暗黙に仮定されているが、明示的に工夫することもある。GDPのようなマクロ経済データも使えるが、レベル1の個々の製品のモデルに使うことはほとんどない。

2.3 短期モデルの推定
 いよいよモデリングなんだけど、通常の需要関数で売上とマーケティング変数との同時的関係をモデル化しているだけでは、消費者は変数の変化に即時的に調整することになってしまうし、背後にあるブランドのテイスト[←?]が無視されてしまう。トレンド項を付け加えてテイストの一般的なドリフトを表現することはできるが、決定論的でありユーザの指定に基づいていて、本当の長期成長を表現できていない。
 そこでふたつの方法を紹介しよう。

 自己回帰分布ラグ(ADL)モデル。$$ LnS_{it} = \alpha_i + T_i + \delta_i + \sum_j^n \sum_k^M \sum_l^T \beta_{ijk} \log X_{kit-l} + \sum_l^T \lambda \log S_{it-l} + \epsilon_{it} $$ [ムキイイイイ。勝手になおさせてもらうと $$ \log S_{it} = \alpha_i + T_{it} + \delta_{it} + \sum_j^n \sum_k^M \sum_l^T \beta_{ijk} \log X_{kj,t-l} + \sum_l^T \lambda_l \log S_{i,t-l} + \epsilon_{it}$$ とちがうんかい!]
 特殊ケースとして以下がある: アドストック、部分調整モデル、誤差修正モデル。[説明が結構わかりにくい… たぶん通常の解説の外側に出る話ではないし、なにしろ数式が信用ならんので、メモ省略。誤差修正モデルについてはBaghestani(1991 J.Industrial Econ.)を読めとのこと]
 一番よく使われているのはアドストック。いずれにせよ、需要は定数(と決定論的な因子)のまわりを変動する。マーケティングの長期効果は捉えられていない。
 長期的効果を捉えるためにはふたつの方法がある。

  • 単位根検定でテイストの進化があるかどうか検定し、誤差修正モデルの非定常版を適用する。共和分VARモデルを用いることになり、売上と他の変数との均衡関係が含まれうることになる。しかし、変数が多いときには大変だし、DF検定のような単位根検定は検定力が弱いし、MA構造を無視しているという欠点がある[Schwert(1987, J.Monetary Econ)を読めとのこと。いやですよ面倒くさい…]
  • 売上レベルの発展を明示的にモデル化する。これはTVP計量経済モデル(後述)で採用されている方法で、テイスト要素の進化を売上から直接抽出し、短期変動と長期変動を分離することができる。

 時変パラメータ(TVP)計量経済モデル。単一方程式の場合でいえば…[ここからは数式を勝手に修正させて頂きます] $$ \log S_{it} = \mu_{it} + \delta_{it} + \sum_j^n \sum_k^M \beta_{ijk} \log X_{jkt} + \epsilon_{it}$$ $$ \mu_{it} = \mu_{i,t-1} + \lambda_{i,t-1} + \eta_{it} $$ $$ \lambda_{it} = \lambda_{i,t-1} + \xi_{it} $$ $$ \delta_{it} = -\sum_j^{p-1} \delta_{i,t-j} + \kappa_{it} $$ $$ \beta_{ikt} = \beta_{ik,t-1} + v_{it} $$ \(\eta_{it}, \xi_{it}\)は独立な正規ホワイトノイズ。\(p\)は年あたり季節数。
 このような動的時系列形式はどの階層のデータにも適用できる。伝統的なADLモデルも表現できる。トレンド要素\(\mu_{it}\)について補足的モデルを組んで長期調整を表現することもできる。
 [やれやれ。こうなったらもう状態空間表現で説明してくれた方がわかりやすいんじゃないかしらん…]

2.4 売上の分解と短期ROI
 単一方程式アプローチの場合の売上分解について… [事例紹介。略]

 絶対的な売上数量の分解ができたとして、メーカーはマーケティング効率の良し悪しを判断したくなる。そのためにはベンチマークが必要になる。同カテゴリの類似したブランドと比べてもよいが、ブランドのライフサイクルも時期も違うという欠点がある。むしろカテゴリのシステムについて推定した方がよい… [事例紹介。略]

2.5 間接的マーケティング効果とトータルROI
 マーケティング投資は売上数量に影響するだけではない。広告はブランドのベース売上レベルに影響するし、価格感受性にも影響しうる。こうした間接的効果を定量化することではじめて真のROIがわかる。
 間接的効果の推定には、マーケティング投資、ブランド知覚、ベース売上、価格感受性についての入力が必要だ。次の5つのステージに分けられる。

  • ベース売上と価格感受性における進化の推定。時変パラメータモデルでベース売上と価格弾力性の時間変化を推定する。
  • 関連するブランド知覚を同定する。ブランドの価値・品質・イメージについての知覚を消費者調査の会社に週次でトラッキングさせておき、4週間移動平均とかで平滑化し、さっきのチャートに重ね描きする。
  • ブランド知覚の需要・価格感受性に対する貢献を調べる。回帰分析では擬似相関を避けにくいので、VECMモデルとかがよろしかろう。[数ページにわたる説明。読み飛ばした]
  • マーケティング投資とベース売上を結びつける。共和分VARモデルのMA表現で… [読み飛ばした。この辺苦手なので、ここで変に苦労して読むよりちゃんとした教科書を読もう、と自分に言い訳]
  • 完全な長期インパクトを求める。時間割引を考えて…[読み飛ばした]

3. Managerial benefits
 従来のMMMであっても、そのベネフィットと用途は広大である。少なくともROIはわかるし、過去のどの活動がうまくいってどれがうまくいかなかったかがわかる。弾力性推定値によって予算の最適配分をアドバイスできるし、所与のシナリオについてシミュレーションできる。
 短期変動と長期変動を明示的に捉えることによってさらに可能性が広がる。(1)戦略的予算配分の拡張。長期リターンを組み込むことでより全体的にバランスの取れた活動を設計できる。(2)クリエイティブ開発の拡張。知覚、ベース売上、価格弾力性の均衡関係に基づき、その因果的関係をテストできるので、長期的にみてどんなクリエイティブが必要かが明確になる。

4. 結論

  • すべてのMMMのルーツは消費者についての経済学的理論である。実務家はついつい、二重対数関数形式の標準的な単一方程式を機械的に適用してしまうが、その市場・カテゴリ・ビジネス課題に応じた理論モデルを考えるべし。
  • 動的な形式を採用し動的な推定手法を使うことが重要。モデルを再構造化しデータの短期的特徴と長期的特徴の両方を明示的にモデル化すること。
  • 時系列構造はマーケティングの正確な短期的結果を提供するだけでなく、中間的なブランド知覚指標の発展と組み合わせることで、マーケティング活動の長期的影響の評価も提供する。

———-
 いやもう、数式に誤植が多そうで往生した。説明も変に曖昧なところがあってわかりにくい。参っちゃうなあ。
 それほど新しい内容はなかったんだけど… あっそうだ、AIDSモデルというのは初耳だったな、調べておこう。それから共和分システムについてちゃんと勉強しておかないと。

 感想。
 マーケティング活動の長期ROI推定にあたって、著者はパラメータを時変させるモデルを推すんだけど、 単に時変パラメータといっても、切片を確率的に変動させるのと、偏回帰係数を確率的に変動させるのとでは、推定上の難度がぜんぜん違うと思うんですよね。特にマーケティング変数の繰越効果をいれた場合、たとえ幾何級数型分布ラグモデル(コイックモデル)のようなきつい制約を課したとしても、効果の変動と効果の繰越を区別するには非常にリッチなデータが必要になると思う。一般にMMMのための履歴データというのはそれほどリッチでない。少なくともブランドレベルの単一方程式の場合、偏回帰係数を時変させて弾力性の変化を調べるだなんて、机上の空論といってよいと思う。
 ブランド知覚をトラッキングしておき需要・価格感受性への貢献を定量化しましょうというのも、いっちゃなんだが絵空事に近いように思う。そもそも「ブランド知覚を週次トラッキングするのが当然でしょ」というのは大企業のよほど大きなブランドの話で、そんな確立されたブランドの知覚はそうそう変動しない(簡単に変動するようでは大ブランドにはなれない)。新ブランドや大規模リニューアルしたブランドについて、立ち上げ期間中にブランド認知や知覚を高頻度でトラッキングすることはありうるし(著者が示している事例はたぶんそういうのだ)、その場合はブランド知覚も変動するかも知れないが、導入期のブランドについてMMMでROI推定するのって稀ではなかろうか。

 いえ、こういうマーケティング・サイエンスの解説に対して「明日の実務の役に立つ」内容を求めているわけではないです。個別具体的な課題というのはいずれもどこかしら特殊なのであって、解説の際に示される理念形を直接適用できるわけではない。
 いいたいことはそうじゃなくて… これって統計手法ドリブンな解説になってませんか? たとえば「パラメータを時変させるモデルを組めるんだよ諸君」というのが先にあり、その用途を後づけで考える形になってませんか? そのせいで現実場面への適用可能性について過度に楽観的になってませんか? ということです。