« 読了:Mahajan, Muller & Bass (1990) 新製品普及モデルレビュー in 1990 | メイン | 読了:Peres, Muller, & Mahajan (2010) 消費者間相互作用とイノベーション普及 »
2016年3月16日 (水)
Sultan, F., Farley, J.U., Lehmann, D.R. (1990) A meta-analysis of applications fo diffusion models. Journal of Marketing Research, 27(1), 70-77.
Sultan, F., Farley, J.U., Lehmann, D.R. (1996) Reflections of "A meta-analysis of applications of diffusion models." Journal of Marketing Research, 33(2), 247-249.
原稿の都合で読んだ。前者は題名の通り、新製品・新サービスの普及モデル(具体的に言うとBassモデル)の実データ適用についてのメタ分析。この論文は学会の大きな賞をもらったのだそうで、後者は著者らによる受賞記念コメント。
まず元論文のほうから。
モデルのおさらい。いまなにかの新製品なり新サービスなりがあるとして、市場におけるその受容プロセスについて考える[←受容とは、とりあえずは初回購入のことだと考えてよいだろう]。潜在的受容者の総数を$N^*$、時点$t$における累積受容者数を$N(t)$、受容率を$g(t)$とする。普及モデルを一般化して書くと、普及の速度について
$d N(t) / d t = g(t) [N^* - N(t)]$
というモデルである。$g(t)$の関数形はいろいろで、たとえば
- $g(t) = P$: 外的影響モデル。広告のような外的要因で普及が駆動されると考える。定数$P$は革新係数と呼ばれている。普及曲線は指数曲線になる。例, Fourt & Woodlock (1960)。
- $g(t) = Q F(t)$: 内的影響モデル。未受容者がその時点での受容者から学習すると考える。定数$Q$は模倣係数と呼ばれている。普及曲線はロジスティック曲線になる。例, Mansfield (1961)。
- $g(t) = P + Q F(t)$: 混合影響モデル。例, Bass (1969)。
これにマーケティング・ミクス変数(価格や広告)をいれて拡張したりする。
メタ分析。50年代以降、実データにモデルを当てはめた論文が15本みつかった。事例数は合計213。$P$の平均は.03、$Q$の平均は.38だったが、分散が大きい。なお、すべて年次データを使っていた。
全事例に以下のコードを振った。
- 製品タイプ: {耐久消費財、産業・医療財、そのほか}
- 国: {米, 欧州}
- 革新係数をモデルに{いれている(161件)、いれてない}
- マーケティング・ミクス変数をモデルに{いれている、いれてない}
- 推定方法: {OLS, ML, そのほか}
- データセット番号(8水準)。先行論文のデータを再分析している論文が多いので、データセットで数えると8つになる由。
これらを要因とし、目的変数を$P$ないし$Q$としてANOVAをやった(目的変数が$P$のときは3つめの要因は除外)。
結果。欧州は革新係数が高い。産業・医療財は模倣係数が高い。革新係数をいれている事例は模倣係数が高い(入れたほうが正しいのだろうとのこと)。マーケティング・ミクス変数を入れてると模倣係数が低い。どっちの係数もOLSのほうがちょっと高め。云々。
なお、このメタ分析モデルの推定自体も、OLSとWLSで比較してみたんだけど...[関心ないので読み飛ばした]
メタ分析の結果をどうやって使うか。
その1、普及過程の持続時間。Bassモデルにいわせれば、普及速度がピークになるまでの時間は
$T^* = (P+Q)^{-1} \log (Q/P)$
である。本研究で使った事例の平均である$P=0.03, Q=0.38$をいれると5.3年。最小の$P,Q$をいれると80年、最大の$P,Q$をいれると1年。これは適当に選んだ例だが、普及過程に要するであろう時間の幅が広いことがわかる。[←おいおい...それはメタ分析のモデルを作らなくても、先行事例を集めた段階でわかっていたことでしょうに]
その2、普及モデルによる予測。[←実をいうと、関心があるのはここだけだ]
普及モデルの最重要な用途は普及初期段階における今後の普及の予測だが、よく知られているように、数時点しかないデータにモデルをあてはめるのは危険である。そこで、メタ分析の結果を事前分布としたベイズ推定を考えよう。このベイズ推定手法は、Durbinの業績に基づく、Goldberger-Theilの「混合推定」アプローチに依存している。すなわち、メタ分析から得た先行する結果を、データに基づく推定値とミックスさせ、パラメータの事後推定値を手に入れるのである。その際、2つの推定値のウェイトは、分散の逆数とする。
Mahajan, Mason, & Srinivasan (1986)のエアコン普及データでやってみよう。メタ分析モデルによれば、米の消費財の推定値は$P=0.00, Q=0.30$。各年度について、それまでのデータを使ってP, Q を推定する。で、Zellner(1971, p.15)に従って事後パラメータを求める。計算には、the analogous matrix formula which accommodates correlation between P and Q (Leamer 1978, pp.182-186)を用いる。
この事後パラメータは、時点数が少ないときはメタ分析のパラメータに近く、時点数が増えるとだんだんデータからの推定値に近くなっていく。
考察。[メモ省略]
95年のコメントの内容はこんな感じ:90年から95年までにこの論文を引用してくれた論文は22本あった。それらで扱われているテーマは、(1)普及モデルの改訂、(2)推定方法、(3)他の製品カテゴリへの拡張。これまでの研究には、成功した製品への偏り、耐久消費財への偏り、北米への偏りがみられる。旧技術の代替製品についても検討が必要。マーケティング研究においてもっとメタ分析が活用されるといいな。云々。
メタ分析モデルを踏まえた初期予測のくだりについてメモしておく。
- 事例のデータ。引用元のMahajan, Mason, & Srinivasan(1986)は手に入らないんだけど、同著者・同題名のワーキング・ペーパー(1985)にエアコン普及のデータというのがある。1949年から1961年までの年次データである。
- メタ分析モデルによって得られるアメリカの耐久消費財の推定値。本論文Table 3.によれば、$P=0.00$(SD:$0.025$), $Q=0.30$(SD: $0.185$)。ためしに、本論文Table 2.のOLS推定値の列から{切片、耐久財、米、革新係数あり、マーケティング変数なし}のパラメータを拾って足し算すると、$P=0.005, Q=0.2985$。たぶんこの拾い方でよいのだろう。
- データからのパラメータ推定。Table 3.によれば、たとえば5年目のパラメータは$P=0.0008$(SD: $0.0350$), $Q=0.50$(SD: $0.750)$。ためしにRのnls()で推定してみたが、エラーになっちゃったので放り出した。
- 事後パラメータの算出。Leamer (1978)という本の該当ページを手に入れたが、線形回帰の感度分析についての話で、これをどう適用したらいいのか... 正直、途方に暮れている。論文中に示されているパラメータP, Qの推定値の分散だけでなく、共分散が必要なのではないだろうか? とにかく、5年目の事後パラメータは$P=0.0003, Q=0.3109$となる由。
- コメント論文によれば、Goldberger-Theilの混合推定をもっと洗練させる提案として、Vanhonacker, Lehmann, & Sultan(1990 J.Business &Econ.Stat.), Vanhonacker & Price(1992 J.Business &Econ.Stat.)がある由。
。。。うーん。このGoldberger-Theilのアプローチって、カルマン・フィルタとどういう関係にあるのだろうか。直観としては、事前分布を使わずにいったんモデルをNLS推定してあとで事前分布と加重平均するのって、無駄な感じがするんだけど。また、新製品普及の初期予測に階層ベイズモデルを使う話があるけど、どっちがいいのだろうか。わからんことだらけだ...
論文:マーケティング - 読了:Sultan, Farley, Lehmann (1990, 1995) 新製品普及モデルのメタ分析