« 読了:「逆さまゲーム」「色彩を持たない多崎つくると、彼の巡礼の年」 | メイン | 読了: Carlson, Suter, Brown (2008) 大事なのは社会的ブランド・コミュニティじゃない、心理的なブランド・コミュニティ感覚だ »
2014年5月28日 (水)
Trusov, M., Rand, W., Joshi, Y.V. (2013) Improving prelaunch diffusion forecasts: Using synthetic networks as simulated priors. Journal of Marketing Research, 50(6), 675-690.
上市前販売予測に社会ネットワークを使うという論文。当面の仕事とは関係ないけど、先日友人といろいろ議論していて、社会ネットワークの話は読んでおいた方がよいと思ったので、隙をみて目を通した。
先行研究レビュー。社会的相互作用ネットワークがマーケティング戦略に与える影響についての研究としては以下がある:
- Goldberg, Libai, & Muller (2001, Mktg Letters)
- Valente (1995, 書籍"Network models of the duffusion of innovations")
- Haenlein & Libai (2013, J.Mktg) : ターゲティングに活用
- Kempe, Kleinberg, Kleinbert, & Tardos (2003, Conf.) : ターゲティングに活用
- Dasgupta, Singh, Viswanathan, & Chakraborty (2008, Conf.) : チャーン予測
- Nitzan & Libai (2011, J.Mktg): チャーン予測
- Haenlein (2011, Mktg Letters): 顧客からの収入の分布
- Iacobucci & Hokins (1992, JMR): 影響力がある人の同定
- Iyengar, Van den Bulte, & Valente (2011, Mktg Sci.): 影響力がある人の同定
- Toubia, Goldenberg, & Garcia (2008, MSI Working Paper): 新製品普及予測; 集計レベルの拡散モデルにネットワーク効果を組み込む
- Rahmandat & Sterman (2008, Mngt Sci.): ネットワーク構造と普及速度
- Van den Blute & Joshi (2007, Mktg Sci.): ネットワーク構造と普及速度
- Van den Blute & Wuyts (2007, "Social networks and marketing". 書籍というより、MSIが出しているモノグラフみたいなものらしい): ネットワーク構造と普及速度
- Watts(2002, PNAS), Watts & Dodds(2007, JCR): 製品普及における影響力がある人の役割
- Goldenberg, Han, Lehmann, & Hong (2009, J.Mktg): 製品普及における影響力がある人の役割
- Shaikh, Rangaswamy, & Balakrishnan (2005, working paper): ネットワーク構造と普及曲線
- Dover, Goldenberg, & Shapira (2012, Mktg Sci.): 集計レベルの普及モデルにネットワーク効果を組み込む; 普及曲線からネットワーク次数を推定
- 本研究の直接の先行研究(集計レベルの普及モデル): Lilien, Rangaswamy, & Van den Blute(2000, "New product diffusion models"), Trajtenberg & Yitzhaki (1989, J. Business & Econ. Stat), Van den Blute & Lilien (1997, Mktg Sci.)
で、この研究の特徴は: 複数の製品の集計レベルの普及曲線(つまり、横軸が上市からの時間、縦軸が購入経験者数を表す曲線)から、その製品カテゴリの消費者相互作用ネットワークの性質を推定する。つまり、普及曲線そのものではなく、普及曲線のパラメータの確率分布を推定するわけである。これを使って予測の精度を上げる。
えーっと... 大変面倒な話だし、詳細は本文には書いてないのだけど(Appendixを読めとのこと。勘弁してください)、かみ砕いてレシピ風にいえば、こういうことだと思う。
まず、シミュレーションでデータベースみたいなものをつくっておく。
- 架空の消費者のネットワークをつくります。格子型、ランダム型、スモール・ワールド型、preferential attachment型(スケール・フリー性を持つ)、の4タイプのネットワークを考える。著者いわく、この分野ではこれだけ調べれば十分なのよ、とのこと。それぞれについて、エッジの密度を4水準で動かして、ネットワークを生成する。4x4=16個のネットワークが手に入る。なお、いずれもノード数は1000とする。
- 新製品の普及(拡散)をシミュレーションします。それぞれのネットワークについて、まず、製品が普及しうるノードを一定割合ランダムに選ぶ。で、ある時点におけるあるノードの製品普及をSIRモデルで表す。SIRモデルのパラメータは受容係数と社会的汚染係数のふたつ(えっ、そうだっけ? 感染率と隔離率だと習ったけど。あとでよく考えてみよう)。つまり、ノードの割合、受容係数、社会的汚染係数の3つのパラメータがあるわけだ。これをいろいろ変えて、計193,600通りのシミュレーションを行い、普及曲線を得る。
- ネットワークごとに普及曲線の分布を調べます。まず、一本一本の曲線にBassモデルをあてはめる(いきなり古い話になるので、ちょっとガクッとなりましたが、それで構わないんでしょうね)。Bassモデルには3つのパラメータがあるけど、そのうち p と q に注目する (もうひとつのパラメータは普及可能者割合の推定だから)。こうして、たくさんの(p, q)が手に入る。で、ほんとはあるネットワークから(p, q)を得るパラメトリックなモデルを作りたかったそうなんだけど、うまくいかないので、pを11階級、qを10階級に切って二次元のヒストグラムを描く。このヒストグラムが4x4=16枚。これを「拡散超立方体」と呼ぶことにする。途中からローテクな割には、やたらにかっこいい名前だ。
次に、実データを使った分析を行うのだが、モデルの立てつけはこうなっている。
ある普及曲線のパラメータ(p,q)は、上の2次元ヒストグラムのどこかのビンに落ちるわけだ。ビンは11x10=110個ある。だから、あるカテゴリで観察された複数の普及曲線のパラメータは、長さ110の頻度ベクトルで表現できる。これを Y とする。
ある製品カテゴリの消費者ネットワークは、上の16個のネットワーク M_1, ..., M_{16} のどれか M_k であると考える。
さあ、Yを生成するモデルを考えよう。
- Yは多項確率分布 \Psi (Y | \theta_k) に従っていると考える。\theta_k は長さ 110の確率ベクトルである。
- \theta_k の事前確率 \varphi (\theta_k | M_k) はDirichlet(\alpha_{M_k})とする。無情報事前分布を使うのではなく、パラメータ \alpha_{M_k}を拡散超立体から得る。もっとも、M_k の2次元ヒストグラムから\alphaを得るにはいろいろ工夫が必要なのだが (すべての\alphaを0より大きくするためにどうのこうのとか、シミュレーションの回数を考慮するためにどうのこうのとか)、省略。
- 消費者ネットワークが M_k である事前確率を p(M_k)=1/16とする。
さて、ある製品カテゴリについて、それが消費者ネットワーク k を持ち、普及曲線のパラメータについての事前確率 \theta_k を持ち、実際の普及曲線のパラメータが Y となる同時確率は
f( Y, \theta_k, M_k) = \Psi (Y | \theta_k) × \varphi (\theta_k | M_k) × p(M_k)
ここから、消費者ネットワーク k の下で普及曲線のパラメータ Y を得る確率は、\theta_kについて積分して
p(Y | M_k) = \int_{\theta_k} \Psi (Y | \theta_k) × \varphi (\theta_k | M_k) d\theta_k
オーケー、いま Y が手に入ったとしましょう。その製品カテゴリが消費者ネットワーク k を持っている事後確率は
p(M_k | Y) = {p (Y | M_k) × p(M_k)} / (分子の総和)
\theta_k の事後分布は
\tilda\varphi (\theta_k | M_k, Y) = \Psi (Y | \theta_k) × \varphi (\theta_k | M_k) / p(Y | M_k)
これから発売される製品から手に入るパラメータの分布 Y* の予測分布は
p( Y* | Y ) = \sum_K p(M_k | Y) × \int_{\theta_k} \Psi(Y* | \theta_k) × \tilda\varphi (\theta_k | M_k, Y) d\theta_k
Y*から(p, q)の平均を求め、普及曲線のパラメータとする。というわけで、過去製品群の普及曲線から、新製品の普及曲線を予測できたわけです。
この方法を通じて、ある製品カテゴリが持っている消費者ネットワークを正しく推測できるとは限らないのだけれど(たとえば低密度なランダム・ネットワークとスモール・ワールド・ネットワークは区別しにくい)、予測の精度は上がるとのこと。
実証研究。2007年から2008年にかけて登場したFacebookアプリ900個の日次インストール数を用いる(どこがデータを持っていたのかしらん...)。それぞれのアプリの普及曲線をBassモデルに当てはめ, パラメータの分布 Yを得た。
なお、p(M_k | Y)を推定したところ、低密度のpreferential attachment型ネットワークにおいて 1 に近い値が得られた。これは社会的ネットワークについての先行研究と合致している (と、バラバシを引用)。Facebookの先行研究では、友達ネットワークは高密度だといわれているが、いま調べているのはアプリ普及の基盤にあるネットワークであって、友達ネットワークそのものではないから、これは矛盾ではない。それに、そもそもネットワークの特性を推測したいわけじゃないので、まあどうでもよい。本題は予測である。
第一試合。600個のアプリをホールドアウトしておき、残りの300個からランダムに選んだアプリ群をテストに用いる。3つの予測方法を比較する。
- 提案モデル。
- ナイーブ・モデル。16個ネットワークに等しい重みを与える。つまり
p( Y* | Y ) = 1/16 × \sum_K \int_{\theta_k} \Psi(Y* | \theta_k) × \tilda\varphi (\theta_k | M_k, Y) d\theta_k - カリブレーション・モデル。学習データのp, qのヒストグラムそのものを使う。
予測の良さの指標は、(p, q)の予測分布とホールドアウトの分布とのK-Lダイバージェンス。結果: 提案モデルの勝ち。ナイーブモデルはわずかに劣る(そうか、消費者ネットワークのトポロジーや密度を頑張って推測したけど、そこには大した旨味はないわけだ)。サンプルサイズが大きくなると差が小さくなる。
第二試合。集計レベルの普及モデルによる予測と勝負する。選手入場です。
- 提案モデル。
- Bassモデル。
- the gamma/shifted ゴンペルツ・モデル。
- ワイブル-ガンマ・モデル。
各アプリのマーケット・サイズを過去データから推定する場合と、別の方法で調べておいてモデル推定の際には既知だとみなす場合の両方を試す(後者の手順についていろいろ説明してあったが、面倒なのでスキップ)。結果: 提案モデルの勝ち。以下、おおまかに、Bassモデル、ゴンペルツモデル、ガンマモデルの順に良い。
考察。クチコミが影響するカテゴリで予測精度はより向上するであろう。今後の課題: マーケット・サイズを拡散超立体に組み込む; 消費者間異質性を組み込む; 学習データになんらかの外的な重みをつける; 製品特性を組み込む。
なるほどねえ...
具体的な場面に当てはめて考えてみよう。これからあるカテゴリのある製品を発売します。マーケット・サイズは消費者調査かなにかで見当がついています。配荷率もわかってます。発売3ヶ月後の普及率(購入経験者率)を予測したいんです。という場面について考えてみる。
まず思いつくのは、インテージ様なりマクロミル様なりにお願いし、過去にその会社が発売した製品だか、競合を含めた全製品だかの月次トライアル購買率のデータをもらってくる。で、普及曲線をBassモデルに当てはめ、そのカテゴリでの標準的な普及曲線を求め、これを使って予測する、という方法である(第二試合のBassモデル)。もしそれで当たるってんなら、それでよろしい。
次に思いつくのは、過去に発売された製品の普及曲線をBassモデルに当てはめ、それぞれの製品についてパラメータを求め、このパラメータの分布を求め、これを使って予測する、という方法である(第一試合のカリブレーション・モデル)。過去の製品の数が何百個もあるのなら、これでよろしい。
ところが、過去の製品の数は数十個しかない、と。そこで提案モデルの登場である。まず著者らのレシピで「拡散超立方体」をつくる。これはコンピュータ・シミュレーションによって作り出された、製品カテゴリと無関係な、普遍的なデータベースであって、消費者がもし(クチコミやらなにやらで)こんな風に相互作用するならば、トライアル率はこんな風に増えますわね、という無数のシナリオを含んでいる。で、過去データとこのデータベースを併用し、上記の謎の数式(p( Y* | Y )の式)に当てはめると、消費者間相互作用について特段の洞察が得られるわけではないんだけど、予測の精度は上がる。というわけである。もちろん、考察で著者も触れているけれど、精度が向上するというのは製品普及にクチコミが影響するカテゴリでの話であろう。
なるほどー。こりゃあ面白いなあ。
実務的には、著者のいうとおり、マーケット・サイズについての確率的推測も同時にできると助かる。また、たとえば発売3ヶ月後の普及率予測に発売1ヶ月後の普及率を使えると便利だ。当該カテゴリの新製品購買におけるクチコミの重要性についてのデータ(リサーチデータやSNSでの出現率)を使えば、わざわざこのモデルを使うべきかどうかを決める手助けになるだろうし、M_kの事後確率推定にも役立つかもしれない。普及曲線を消費者のデモグラフィック属性別に切って調べるのも、精度向上の役に立ちそうだ。などなど。。。いずれも、簡単に拡張できそうだ。
「社会ネットワークを使います」という割には地味な展開の論文なんだけど(消費者相互作用自体について知見を得ようとはしないから)、でもすごく面白かった。
論文:マーケティング - 読了: Trusov, Rand, Joshi (2013) 社会的ネットワークで新製品普及予測を改善する