« 読了:Hong & Page (2004) 平凡な人々のグループが賢い人々のグループよりも賢くなるメカニズム | メイン | 1946年に毎日新聞がpublic opinionという意味で「世論」という言葉を最初に使ったいきさつ秘話 »
2018年10月19日 (金)
データ解析が活躍する分野は多々あるが、私がたまたまお世話になっております市場調査というのは、そのなかでもかなーり日陰のほうにある、かなーり地味な分野であって、我こそはデータ解析の専門家!と胸を張るような人はそうそういないように思う(いらっしゃいましたらすいません)。だからこそ私みたいな素性の知れない奴がうろちょろしている、という面もある。
もっともグローバルの市場調査会社は、R&D部門に本格的な統計家を抱えていることがあって、その例として私の頭に浮かぶのは、LipovetskyとConklinという人たち。応用統計系の学術誌に結構な数の論文を載せているのだが、ご所属はUSのGfKである。
Conklin, M., Lipovetsky, S. (2013) The Shapley Value in Marketing Research: 15 Years and Counting. Proceedings of the Sawtooth Software Conference.
仕事の都合でシャープレイ値についてお問い合わせを頂いたので、調べるついでに目を通してみた。前にSawtooth社のカンファレンスのproceedingsを眺めていたときに気が付き、面白そうだな、と思っていた奴。
ゲーム理論の本にシャープレイ値というのが出てくるけど、マーケティングリサーチでもたまーに見かけることがある。それを最初に提案したのは俺たちだぜ、という回顧談である。
いわく、
1998年、我々2人はTURF(total unduplicated reach & frequencyね)について研究していた。TURFはもともと雑誌への広告出稿の文脈で出てきた概念で[←へー!]、リーチを最大化する出稿誌の組み合わせを見つけるというのが目標であった。これが製品ライン最適化に応用された。
当時の標準的手続きは次の通り。あるラインにおけるフレーバーの候補集合のそれぞれについて購入意向を訊く。で、どちらかに「必ず買う」と答える人の人数を最大化するペアを見つける, 三つ組を見つける, 四つ組を見つける...。これはNP困難問題である。
当時Lipovetskyさんはマーケティングリサーチ業界に参入したばかりだったのだが、この計算をみて云った。「これって...ゲーム理論でいうシャープレイ値に似てない?」「なにそれ?」
これが二人の、15年間にわたるゲーム理論の世界への冒険の始まりであった。[←ひゅー、かっこいいー]
シャープレイ値とはなにか。これはShapleyが1953年に発表したもので、協調型ゲームにおいて、ゲームによって作られた価値の全体を、個々のプレイヤーに配分するものである。
プレイヤー$i$のシャープレイ値は,
$\phi = \sum_{S - all subsets} \gamma_{n(s)} [v(S) - v(S-\{i\})]$
$\gamma_{n(s)} = \frac{(s-1)!(n-s)!}{n!}$
[記法が大変不親切で、読み手に理解させようと思ってないだろ?という感じなのだが、$S$は可能なすべての提携を表すインデクス、$v(S)$は提携$S$の下でのゲームの特性関数値、$n(S)$はプレイヤー数、$S-\{i\}$とは「$S$から$i$を除いた集合」を指しているのであろう]
要するに、プレイヤーのすべての可能な下位集合$S$を通じて、あるプレイヤーが入っている場合の価値から入っていない場合の価値を引いた値を重みをつけて合計したものである。いいかえると、あるプレイヤーがなんらかの他のプレイヤーの集合に参加したときの限界価値である。[文章にするとわかりにくいね...]
この概念をTURFに適用すると、プレイヤーは製品、価値はリーチ、シャープレイ値はリーチの配分である。
幸いにして、TURFはゲーム理論で言うところのシンプルゲームである。あるゲームの価値は1か0。ある提携が1を得たら、その提携の全てのプレイヤー($r$人とする)がシャープレイ値として$1/r$を得る。つまり、ある製品集合がある消費者にリーチしたら、そこに含まれるすべての製品が$1/r$を得る。
シンプルゲームは結合が可能である。つまり、ある消費者をあるゲームとみなしてシャープレイ値を求め、すべての消費者を通じて平均すればよい。
というわけで、TURFはNP困難であるにも関わらず、シャープレイ値はかんたんに計算できる。マーケティングの観点からみて、ここでいう価値とはなにかというと [...シャープレイ値を製品の購入確率として捉えることができるよね的な話。わかりにくいので中略...] というわけで、消費者をカテゴリ購入頻度と一回当たり購入数量で重みづけて集計すれば、有用なビジネスツールとなるであろう。
一般に小売店のカテゴリ責任者は、製品の売上を順位づけし、下位にある製品を外す。シャープレイ値を使えばもっと良い案を提示できる。
シャープレイ値を使うなら、TURFのやり方もちょっと変えたほうが良い。単に自社製品について意向を聞くんじゃなくて、競合こみのリストを提示し、これまでに買ったことがある奴を時間制限つきで選ばせるのがお勧め[←なるほど]。新製品について調べる場合は、今買ってる製品と新製品のリストを提示して順位づけさせるのがお勧め。
他の使い方もある。たとえば、回帰分析で$R^2$を予測子に分配するとき...
[シャープレイ値を回帰モデルにおける予測子の相対的重要度の指標として使うという話である。この話題、それはそれですごく関心があるんだけど、この文章だと書き方がカジュアルすぎてかえってわかりにくいので、メモは省略。お二人は2000年代に、この問題について何本も論文を書いているのである。Gromping & Landau(2009)による批判とLipovetsky & Conklin (2010)での応答についても一言触れている。私はGrompingさんのほうに分があると思った覚えがあるんだけど、当人としては言い負けたと思ってない模様]
シャープレイ値のいいところは効用関数が抽象的だというところだ。たとえば狩野理論と組み合わせて...
[これも説明が端折られすぎててわかりにくいので省略するが、Conklin, Powaga, & Lipovetsky (2004)の紹介であろう。前に読んだ気がする]
というわけで、マーケティングリサーチにシャープレイ値を適用して15年、大変有用な手法であることがわかった。ビジネスというのは結局のところ優先順位づけである。シャープレイ値はそのための簡易な方法を提供してくれる。
云々。
... さきほど検索してみたところ、SNSではお二人の所属はまだGfKとなっていた。先日GfKのカスタムリサーチ部門はIpsos社に買収されたのだが、お二人はIpsosに残るのかしらん。
論文:マーケティング - 読了:Conklin & Lipovetsky (2013) マーケティングリサーチにおけるシャープレイ値の使い道