« 読了:Binder (2015) 回答におけるキリの良い数字に注目して確信度を測定する | メイン | 読了:Hoeting, et al. (1999) ベイジアン・モデル・アベレジーングへの招待 »
2016年2月 4日 (木)
Dahan, E., Mendelson, H. (2001) A Extreme-value model of concept testing. Management Science, 47(1), 102-116.
仕事の足しになるかと思ってざっと目を通した。
コンセプト・テストについての論文ってのは最近ではちょっと珍しい。えーと、ここでいうコンセプト・テストというのは、ある製品なりサービスなりを開発している途中で、その(実物じゃなくて)コンセプトについて潜在顧客がどう思うかとか、商品化した暁には買ってくれるだろうかとか、そういうのを調べることを指している。こういう市場調査の定番的課題についての議論はとっくに枯れちゃってて、情報を仕入れようにも、かえってろくなものがない。
第一著者は予測市場のマーケティング応用なんかをやっているMITのEly Dahanさん。タイトル通り、コンセプト・テストに極値分布を使ったモデルを使いましょうという話である。先生ってば、またそういう変なことを...
いわく。
新製品開発(NPD)の初期段階(ファジー・フロント・エンド)での手法としては、VOCとかリードユーザ分析とかコンジョイント分析とか狩野法とかPughのコンセプト選択とかいろいろある。コンセプト・テストは最良のデザインとか価格とかを探索する手法であると考えられている。きちんとやれば利益の期待値は上がるがコストもかかる。
コンセプト・テストの先行研究は次の3つに分けられる。
- 探索プロセスのモデル化。テストあたり費用と不確実性によって、同時にテストするコンセプトの最適な数が決まるとか(Nelson,1961;Abernathy & Rosenbloom,1968)、実験計画法を導入すればこんなにいいことがあるよとか(Thomke 1998MgmtSci, 1998Res.Policy)、同時並行的プロトタイピングは一発勝負より儲かるとか(Srinivasan et al., 1997JMR)。
- コンセプトをリアル・オプションとしてみるアプローチ。Hauser(1996 Working Paper), Hauser & Zettelmeyer(1996 Res.Tech.Mgmt.), Baldwin & Clark(2000 "Design Rules")を読め。[←実物資産を金融オプションみたいに評価することをリアル・オプションというそうだ。知らんがな、そんなん。最後のClarkって、藤本&クラークのクラークじゃないかしらん...]
- 開発手法を提案したり調べたりする研究。開発スピードを速める並列的テストとか(Smith & Reinerten, 1995書籍)、同じ失敗するのでも前向きな失敗があるとか(Leonard-Barton 1995書籍)、社内でデザインチームを競争させることの良し悪しとか(Wheelwright & Clark 1992書籍)、技術的問題への同時並行的テストが新技術によって促進されたとか(Thomke et al. 1997Res.Policy)。Dahan & Srinivasan のWeb調査手法とか、[この段階ではまだ論文になってないようだが] Dahanたちの市場メカニズム応用例 STOC なんかも、この路線である。
提案モデル。
次のように想定しよう。それぞれのコンセプトの利益は独立。それぞれのコンセプトは最良の下位コンセプトからなる[←もうrefineされ尽くしているという意味であろう]。利益の分布パラメータは企業と製品カテゴリに依存する。テストにかかるコストはコンセプトあたりで一定。テストしたいすべてのコンセプトを同時並行でテストできるけど、コンセプト数は事前に決めないといけない。利益の期待値が一番でかいやつを上市する。
コンセプト・テストを特徴づけるパラメータってのは、結局次の3つだ。コンセプトあたりのテストのコスト $c$、利益の潜在的不確実性 $b$、そして利益の分布の右の裾の太さ $\alpha$。いま、$n$個のコンセプトを同時にテストするとしよう。コンセプト $i$ の利益を$x_i$とする。
コンセプト数$n$を大きくすれば、利益の最大値$\pi_n$の期待値$E[\pi_n]$が大きくなるけど、コスト$n \cdot c$が増大する。最適なコンセプト数を$n^*$とする。話を簡単にするために、コンセプト数は連続的に動くことにする(実際には整数だけど)。
話を簡単にするために、あるコンセプトについてテストすれば、そのコンセプトから得られる利益$x$が直接にわかっちゃうってことにしよう。
$x$は確率分布$F(x)$に従う確率変数だとする。$n$個の独立したテストの結果の最大値の累積分布は$[F(x)]^n$だ。[←しれっとこう書いてあるけど、ちょ、ちょっと待って... 確率変数$X$の累積確率分布を$G(x)=P(X \leq x)$として、 独立な実現値$x_1, x_2, \ldots, x_n$の最大値が$x$以下である確率は$P(x_1 \leq x) \cdot P(x_2 \leq x) \cdots P(x_n \leq x) = [G(x)]^n$じゃないですか? ってことは、この論文では$F(x)$を確率分布と呼んでいるけど、実は累積確率分布なの?]
その確率密度関数は$n \cdot f(x) \cdot [F(x)]^{n-1}$だ。よって期待される利益は
$E[\pi_n] = n \int^\inf_{-\inf} x \cdot [F(x)]^{n-1} \cdot f(x) dx - c \cdot n$
これを解いて...[中略]... コンセプト数$n$を1増大させることによる限界利益を算出できる。
もし「どれも儲かりそうになかったらなにも上市しない」という選択肢を許すと... [略]
[さあ、ここが本題だ。だんだん読む気が失せてきたけど]
分布$F(x)$は当該コンセプトの利益の不確実性を表している。これは、過去データとかから推定される、そのカテゴリの利益の分布$H(x)$とはちがう。なぜなら、$H(x)$は一般的な利益の分布であり、そこから取り出したありうるコンセプトの巨大な下位集合の、そのまた最大値が、テストされるコンセプトだからだ。つまり、$F(x)$は$H(x)$からランダム・ドローした標本の最大値だと考えられる。$H(x)$の性質に応じて、$F(x)$はフレシェ分布、ガンベル分布、ワイブル分布になるか、あるいはそのどれにもならない。なお、「当たればでかい」製品カテゴリはフレシェ分布、当たっても上限がある製品カテゴリはワイブル分布、だいたい利益が決まっているような製品カテゴリはガンベル分布で表現される。
事例。Inhaleという会社についての実例である。[現在はNektarという社名らしい]
この会社はインシュリンみたいな薬を吸入して肺の奥深くに届けるというシステムを開発している。VCからすごいお金が流れ込んでいる。3つの開発プロジェクトが進んでいる。(A)薬を乾燥した粉にする方法の開発。(B)粉を安く作って梱包する方法の開発。(C)吸入装置の開発。それぞれ他の会社に売ることを考えている。
過去データとかシミュレーションとかで、それぞれのコンセプトの利益の確率分布関数を推定した(その方法はこの論文の本題ではない)。Aはフレシェ分布[←ワイブル分布やガンベル分布と同じく、極値分布の一種なのだそうだ]、Bはワイブル分布、Cはガンベル分布となった。ここから各カテゴリにおける最適コンセプト・テスト数が出せました。
考察。企業のみなさん、新製品の評価をする際には、利益の期待値と分散だけでなく、分布の右裾の太さを考えなさい。テストするコンセプト数をカテゴリごとに最適化しなさい。云々。[他も書いてあるけど省略。「効率の良いテスト手法を考えなさい」なんて、この論文で説教されても困る]
。。。理解できているのか怪しいものだが、要するにこういう論文だったのではないかと思う。
- (1)コンセプト・テストってのは上市後の利益を測るものだよね。
- (2)仮に適当に思いついた製品を上市したら、その製品の利益がどうなるかはわかんないけど、仮にもコンセプト・テストにかけようという製品であればきちんと考え抜かれたものであろうから、その利益の分布はきっと極値分布だよね。それがガンベル型かフレシェ型かワイブル型かは知らねども。
- (3)そのつもりで、ひとつ、コンセプト・テストをやる前に、各製品の利益の分布を極値分布として表現してみなさいな。
- (4)そしたら、何個のコンセプトについてテストすればいいかとかがわかるよ。
- (5)このモデルのおかげでね。
正直、一読して、ぽかーんとしてしまう内容であった。ぽかーん。
多くの研究がそうであるように、この論文もさまざまな想定に基づいているので、どれが非現実的か、またどれがクリティカルか、きちんと考えないといけない。
- まず、(1)コンセプト・テストってのは上市後の利益を測るものだよね、という想定。実際の製品開発では、コンセプト・テストは初期段階に行われるのが普通で、実際の製品・サービスがどうなるかはまだまだわかんないから、「上市後の利益を測っているんだ」というのは相当な違和感があると思う。でもまあ、それはコンセプト・テストになにを期待するかという話であって、上市後の利益がわかるならそれに越したことはないし、利益$x_i$がテストで直接に観察できないとしても、$E[x_i]$が測定されるのだという方向にモデルを拡張することはできる(この点は著者らも述べている)。相当に非現実的だけど、クリティカルな想定ではないと思う。
- (2)テスト対象となるコンセプトの上市後の利益は極値分布に従う、という想定はどうだろうか。うーん、コンセプト開発を「問題空間の下位空間の最大値探索」と捉えることはできるのかしらん? 実際はそうじゃないんじゃないの、と思うんだけど、これは実証的な議論が必要な話だと思う。クリティカルな想定ではあるけれど、非現実的とはいえない。
- (3)コンセプト・テストをやる前に、各コンセプトの利益の分布を表現できる、という想定。多くの人にとってはここが一番びっくりする想定ではないかと思う。「コンセプト・テストをやりたいのね、じゃあその前に、このコンセプトが上市されたときの利益がどうなるか、確率分布で表現して提出しなさい」と命じられたマーケターは、きっと目を白黒させると思うぞ。それがわかんないからテストしたいのに。でもまあ、そういう発想じたいはわからんでもないし(ベイズ推論風に言えば、背景知識によって事前分布を決めろ、といっているわけだ)、データ・リッチなこのご時世、実際にもあり得ない話じゃないと思う。
- (4)テストの最適コストやコンセプト・テスト数が知りたい、という想定。これも、ちょっとレアであるような気はする。ビジネスの規模にもよるけれど、(この論文で想定しているように)仮にコンセプト・テストによって上市後の売上が正確にわかるというならば、テストのコストなど微々たるものだ、といえる場合が多いだろう。でもまあ、非現実的とまではいえない。 ビジネスの規模が小さいとか、テストに莫大な金がかかるとか、そういう事情があるかもしれないし。
こうして整理すると、一番あっけにとられるのは、(5)このモデルでコンセプト数を決める、という点である。
なぜ? なぜここまで苦労して、コンセプト数の最適値を解析的に決めないといけないの? 解を閉形式で書くってのはそんなにすごいことなの?
だって、コンセプト・テストで上市後の利益がわかるんでしょう? その確率分布も事前にわかっているんでしょう? テストのコストを所与として、全体の利益を最大化するためには何個テストすればいいかがわかればいいんでしょう? コンセプトの数は絶対に整数で、いくら多くてもせいぜい一桁でしょう?
。。。いろんなコンセプト数についてモンテカルロ・シミュレーションすればいいじゃん!!!
論文:マーケティング - 読了:Dahan & Mendelson (2001) コンセプト・テストの極値モデル