elsur.jpn.org >

« 2014年3月 | メイン | 2014年5月 »

2014年4月15日 (火)

 人々に次の2問を聴取する。問1は、選択肢m個の単一選択設問。問2は、問1に対して人々がどうこたえるかの予測。たとえば、問1「これまでに万引きしたことがありますか?」, 問2「問1にハイと答える人は調査対象者のうち何パーセントだと思いますか?」。
 十分に多くの人から回答を集め、問1と問2を集計する。で、各個人について「情報スコア」 と「予測スコア」 を求める。
 情報スコアは、その人が問1で選んだ選択肢についての
 log (問1でのみんなの選択率/問2でのみんなの予測の平均)
とする。情報スコアは、「みんなが思ったよりも多くの人が選んだ選択肢」で正の値、「みんなが思ったよりも少ない人が選んだ選択肢」で負の値になる。
 予測スコアは、全選択肢を通しての、
 log(問2でのその人の予測 / 問1でのみんなの選択率) x (問1でのみんなの選択率)
の合計とする。予測スコアは、問2が完璧にあたっていたら 0となり、外れた程度に応じて伴って負の大きな値になる。
 で、2つをあわせた次のスコアを求めて
 (情報スコア) + $\alpha$ (予測スコア)
この値に応じて報酬を渡すことにする。
 各個人は報酬を最大化するような回答を示すとしよう。すると何が起きるか。

 ある人$r$の本当の答えをベクトル$t^r$で表す。上の例では、選択肢が(イイエ, ハイ)の2つで、もし$r$さんは本当は万引きしたことがある人だったら、$t^r=(0,1)$である。つまり、$t^r$はどこかの要素が1, ほかの要素が0である。なお、$t^r$のk番目の要素を$t_k^r$と表す。また、本当の答えが$i$であること、つまり$t^r$の$i$番目の要素が1であることを$t^r_i$と略記する。
 同様に、$r$さんの問1の回答を$x^r$,問2の回答を$y^r$とする。上の例で、$r$さんの回答が問1「イイエ」問2「20%」だったら、$x^r = (1,0), y^r=(0.8, 0.2)$である。$y^r$はどの要素も0以上、全要素を足すと 1 になる。
 問1, 問2の各選択肢における平均を、それぞれ以下のように定義する。
 $\bar{x}_k = \lim_{n → \inf} (1/n) \sum_r x_k^r$
 $\log \bar{y}_k = \lim_{n → \inf} (1/n) \sum_r \log y_k^r$
$y$のほうで対数をとっているのは、幾何平均を使いたいからで、他意はない。
 情報スコアと予測スコアは、それぞれ下式となる。
 (情報スコア) = $\sum_k x_k^r \log(\bar{x}_k/\bar{y}_k) $
 (予測スコア) = $\sum_k \bar{x}_k \log (y_k^r / \bar{x}_k)$

 母集団における$t$の分布をベクトル$\omega$で表す。たとえばさっきの例で、本当の答えがyesの人が全体の2割なら、$\omega = (0.8, 0.2)$である。それぞれの人の本当の答え $t^1, t^2, ..., t^n$は、$\omega$の下で互いに独立であると仮定する。
 選択肢$k$のみんなの選択率に対する$r$さんの推測(問2への回答そのものかどうかはわからない)を$p(t_k | t^r)$と表す。何度も読み返してようやく気がついたのだが、この表記の気持ち悪さのせいで話がすごくわかりにくくなっていると思う。$t^r$はrさんの信念を表す記号で、$t_k$は自分以外の他の人の信念についての信念を表す記号なのだ。書き分ければいいのにと思う。
 もし本当の答えが違っていたら推測も違っていると仮定する。つまり、もし$t^r \neq t^s$なら$p(t_k | t^r) \neq p(t_k | t^s)$である。
 いま、両方の問いに対して全員が正直だと仮定しよう。このとき、問1, 問2の平均は
 $\bar{x}_k = \omega_k$
 $\log \bar{y}_k = \sum_j \omega_j \log p(t_k | t_j)$
原文では右辺の$\sum$の上添字が$n$になっているけど、$m$ではないかしらん。

 本当の答えが$i$である人が、他の人は正直だと仮定したとき、自分の回答$j$によって得られる情報スコアの期待値
 $E(回答$j$への情報スコア | t_i) = E( \log(\bar{x}_j/\bar{y}_j ) | t_i)$
について考えよう。
 実は、上の式は次のように変形できる。
 $E(回答$j$への情報スコア | t_i) = \sum_k p(t_k | t_i) \int p(\omega | t_k, t_i) \log (p(\omega | t_k, t_j) / p(\omega | t_k)) d\omega$

 ここからはそのプロセス。さあ深呼吸。
 まず、$\bar{x}_j$と$\bar{y}_j$は$\omega$で決まるので、$\omega$で積分する形に書き換える。
 $E(回答$j$への情報スコア | t_i) = \int p(\omega | t_i) E( \log (\bar{x}_j / \bar{y}_j) | \omega) d\omega$
 積分のなかの期待値記号の内側, $\log (\bar{x}_j / \bar{y}_j)$について考える。
 $\log (\bar{x}_j / \bar{y}_j) = \log \bar{x}_j - \log \bar{y}_j$
問1の平均, 問2の平均を放り込んで
 $= \log \omega_j - \sum_k \omega_k \log p(t_j | t_k)$
第1項を第2項の$\sum$のなかにいれて
 $= \sum_k \omega_k (\log \omega_j - \log p(t_j | t_k))$
 $= \sum_k \omega_k \log (\omega_j / p(t_j | t_k))$
期待値記号の中に戻すと
 $E( \log (\bar{x}_j / \bar{y}_j) | \omega) = \sum_k \omega_k \log (\omega_j / p(t_j | t_k))$
元の式に戻すと
 $E(回答$j$への情報スコア | t_i) = \int p(\omega | t_i) \sum_k \omega_k \log (\omega_j / p(t_j | t_k)) d\omega$
$\sum$を頭にだしてやって
 $= \sum_k \int \omega_k p(\omega | t_i) \log (\omega_j / p(t_j | t_k)) d\omega$
$\log$の左側は、
 $\omega_k p(\omega | t_i) $
 $= p(\omega, t_k | t_i) $
 $= p(t_k | t_i) p(\omega | t_k, t_i) $
$\log$の内側は、トリッキーだけど、
 $\omega_j / p(t_j | t_k) $
 $= {p(t_j | \omega) p(t_k | t_j, \omega)} / {p(t_j | t_k) p(t_k | \omega)}$
 $= p(\omega | t_k, t_j) / p(\omega | t_k)$
 あわせて、
 $E(回答$j$への情報スコア | t_i) = \sum_k p(t_k | t_i) \int p(\omega | t_k, t_i) \log (p(\omega | t_k, t_j) / p(\omega | t_k)) d\omega$
となる。やれやれ。

 話を本筋に戻して、本当の選択肢$i$とウソの選択肢$j$を比べると、
 $E(回答 i への情報スコア | t_i) - E(回答 j への情報スコア | t_i)$
 $= E( \log(\bar{x}_i/\bar{y}_i ) | t_i) - E( \log(\bar{x}_j/\bar{y}_j ) | t_i) $
 $= - \sum_k p(t_k | t_i) \int p(\omega | t_k, t_i) \log ( p(\omega | t_k, t_j)/p(\omega | t_k, t_i) ) d\omega$
ええと、イエンゼンの不等式というのがあって、Wikipediaによれば、$p(x)$が正で合計1のとき、凸関数$f(x)$について
 $\int f(y(x)) p(x) dx > f (\int y(x) p(x) dx)$
なのだそうであります。これを使って
 $> - \sum_k p(t_k | t_i) \log { \int p(\omega | t_k, t_i) p(\omega | t_k, t_j)/p(\omega | t_k, t_i) d\omega }$
$\log$の内側を見ると、
 $\int p(\omega | t_k, t_i) p(\omega | t_k, t_j)/p(\omega | t_k, t_i) d\omega$
 $= \int p(\omega | t_k, t_j) d\omega$
 $= 1$
なので、結局
 $E(情報スコア | t_i) - E(情報スコア | t_j) = 0$
である。
 つまり、他の人の回答が正直だと仮定すれば、情報スコアを最大化する回答とは、正直な回答である。

 では、自分の予測スコアを最大化するためにはどうしたらよいか。途中すっ飛ばすけど、
 $E \{ \sum_k \bar{x}_k \log (y_k / \bar{x}_k) | t_i \}$
 $= \sum E \{ \omega_k | t_i \} \log y_k - E \{ \sum_k w_k \log w_k | t_i \}$
第二項は自力では如何ともしがたい。予測スコアを最大化するのは
 $y_k = E \{ \omega_k | t_i \} = p (t_k | t_i) $
つまり、正直な回答である。

 というわけで、正直に答えることがベイジアン・ナッシュ均衡となる。
 疲れたのでやめるけど、ほかの均衡解もあるうるが、この解の情報スコアよりも大きくなることはないことも示せる由。

 以上、Prelec さんの「ベイジアン自白剤」論文(2004, Science)のsupplementary material から抜粋。
 哀しいかな、このたった12ページにこの週末を捧げたのに、いまだ腑に落ちない。なんだか狐につままれたような気分だ。

 2015/02/22追記: 数式の誤りを修正。

論文:予測市場 - 「ベイジアン自白剤」メモ

2014年4月 9日 (水)

Bookcover 道元の思想―大乗仏教の真髄を読み解く (NHKブックス No.1184) [a]
頼住 光子 / NHK出版 / 2011-10-27
ぼんやり読んでいたもので、あまり頭に入らなかった。残念。

哲学・思想(2011-) - 読了:「道元の思想」

Bookcover 九月、東京の路上で 1923年関東大震災ジェノサイドの残響 [a]
加藤 直樹 / ころから / 2014-03-07
関東大震災の際の朝鮮人・中国人虐殺についてまとめた本。読んでいて気が滅入る辛い内容だが、丁寧に作られた良書だと思う。

日本近現代史 - 読了:「九月、東京の路上で」

Bookcover わらの女 【新版】 (創元推理文庫) [a]
カトリーヌ・アルレー / 東京創元社 / 2006-06-27
久々の海外ミステリだが、これは1956年発表の犯罪小説の古典。テレビの二時間ドラマの悪女もののご先祖様のような話であった。
 ヒロインが億万長者の心を奪うに至る駆け引きのくだりが面白かった。

Bookcover 国境の向こう側 (ハヤカワepi文庫) [a]
グレアム グリーン / 早川書房 / 2013-11-22
マイナーな短編から未完の作品まで、グリーンの断簡零墨を集めました、という感じの短編集。孤独なウェイターを描いた「真実の瞬間」、南米の将軍にインタビューする女性を描いた「将軍との会見」の二作が抜きんでて良いと思った。

フィクション - 読了:「わらの女」「国境の向こう側」

Bookcover フェルメールになれなかった男: 20世紀最大の贋作事件 (ちくま文庫) [a]
フランク ウイン / 筑摩書房 / 2014-03-10
フェルメールの贋作者として知られるファン・メーヘレンを中心にしたノンフィクション。

Bookcover 創作の極意と掟 [a]
筒井 康隆 / 講談社 / 2014-02-26

Bookcover カラー版 - スキマの植物図鑑 (中公新書) [a]
塚谷 裕一 / 中央公論新社 / 2014-03-24
雑草の図鑑。ときどきこういうのが無性に読みたくなる。

ノンフィクション(2011-) - 読了:「創作の極意と掟」「スキマの植物図鑑」「フェルメールになれなかった男」

Bookcover よるくも 5 (IKKI COMIX) [a]
漆原 ミチ / 小学館 / 2014-03-28
貧困と死に満ちた架空世界を描くファンタジー、完結巻。生の象徴としての食を執拗なまでに描く。エッジの効いた面白いマンガだった。

Bookcover 重版出来! 3 (ビッグコミックス) [a]
松田 奈緒子 / 小学館 / 2014-03-28

Bookcover めしばな刑事タチバナ13 (トクマコミックス) [a]
坂戸佐兵衛,旅井とり / 徳間書店 / 2014-04-03

Bookcover 僕らはみんな河合荘 1 (ヤングキングコミックス) [a]
宮原 るり / 少年画報社 / 2011-05-30

Bookcover 僕だけがいない街 (1) (カドカワコミックス・エース) [a]
三部 けい / 角川書店(角川グループパブリッシング) / 2013-01-25

Bookcover あさひなぐ 11 (ビッグコミックス) [a]
こざき 亜衣 / 小学館 / 2014-03-28
気恥ずかしくなるくらい正統的なスポーツマンガ。高校生の部活の話なんて、世界でもっともどうでもいい話題の一つだと思うんだけど、なぜか面白い。

コミックス(2011-) - 読了:「あさひなぐ」「よるくも」「僕だけが居ない街」「僕らはみんな河合荘」「めしばな刑事タチバナ」「重版出来」

Bookcover 湯けむりスナイパーPART3 (2) (マンサンコミックス) [a]
ひじかた 憂峰 / 実業之日本社 / 2012-04-20
Bookcover 湯けむりスナイパーPART3 (3) (マンサンコミックス) [a]
ひじかた 憂峰 / 実業之日本社 / 2013-08-29
マンガ史上に残る優れた題名を持つ長期シリーズ。昨年の掲載誌休刊とともに完結していた。第三期の開始時点では、絵柄も筋も荒れているように思えて、どうなっちゃうのかと心配したのだが、無事に持ち直していて良かった。
 それにしても、こうして読み返してみると、作画が素晴らしいんだなあ。メジャーな青年誌ではもうあまり見かけない、古い感じの絵柄だけど、とても美しい。

Bookcover うちの妻ってどうでしょう?(6) (アクションコミックス) [a]
福満 しげゆき / 双葉社 / 2014-02-28

Bookcover リバースエッジ大川端探偵社 4 (ニチブンコミックス) [a]
ひじかた 憂峰 / 日本文芸社 / 2012-09-28

Bookcover ヒナまつり 6 (ビームコミックス) [a]
大武政夫 / KADOKAWA/エンターブレイン / 2014-03-03

Bookcover さよならタマちゃん (イブニングKC) [a]
武田 一義 / 講談社 / 2013-08-23
抗がん治療の闘病記。良いマンガであった。

コミックス(2011-) - 読了:「うちの妻ってどうでしょう」「リバーズエッジ 大川端探偵社」「湯けむりスナイパー」「さよならタマちゃん」「ヒナまつり」

読んだ本が溜まっちゃったので、記録しておく。とりあえずコミックスのみ。

Bookcover ちいさこべえ 3 (BIG SPIRITS COMICS SPECIAL) [a]
望月 ミネタロウ / 小学館 / 2014-03-28
いまなぜ山本周五郎「ちいさこべ」をマンガ化しないといけないのだろうか、と不思議に思っていたが、ようやく納得。直接に震災が描かれているわけではないが、これは3.11以降の状況のなかで描かれたマンガなのだ。

Bookcover もう体脂肪率なんて知らない (ビームコミックス) [a]
三好 銀 / KADOKAWA/エンターブレイン / 2014-02-24

Bookcover 独身OLのすべて(1) (KCデラックス モーニング) [a]
まずりん / 講談社 / 2014-03-20

Bookcover 女子のてにをは 1 (ビッグコミックス) [a]
るなツー / 小学館 / 2013-11-29

Bookcover 花咲さんの就活日記 3 (IKKI COMIX) [a]
小野田 真央 / 小学館 / 2014-02-28

Bookcover イノサン 4 (ヤングジャンプコミックス) [a]
坂本 眞一 / 集英社 / 2014-03-19

Bookcover もやしもん(13)<完> (モーニング KC) [a]
石川 雅之 / 講談社 / 2014-03-20
完結。お疲れ様でした。

コミックス(2011-) - 読了:「女子のてにおは」「もう体脂肪計なんて知らない」「独身OLのすべて」「ちいさこべえ」「花崎さんの就活日記」「イノサン」「もやしもん」

2014年4月 8日 (火)

Spann, M. & Skiera, B. (2003) Internet-based virtural stock markets for business forecasting. Management Science, 49(10), 1310-1326.
 予測市場による市場予測の解説。寝不足なのか春のせいなのか、あまりに眠かったもので、要点をメモしながら読んだ。

1. イントロダクション
 市場予測は大事だ。計量経済学的モデルによる外挿のためには過去のデータが未来についての情報を含んでいることが必要である。消費者調査・専門家調査は誰にどう聴くかが難しいし時間もかかる。本論文ではネット仮想株式市場(VSM)を中短期の市場予測に用いることができると主張する。
 VSMはすでに選挙予測に適用され精度が高い。しかし市場予測は選挙予測とちがい、(1)もっと複雑で、(2)予想に使える情報が貧弱で、(3)専門家を参加させるためにインセンティブをうまく設計する必要があり、(4)予測が求められる頻度が多い。
 いっぽう、VSMによる市場予測がもしうまくいけば、(1)情報がはいるたびに素早く予測できるようになり、(2)いろいろな専門家の意見を集約するために重みづけを考える必要がなくなり、(3)低コストで、(4)単なる参加ではなく真の評価に対して報酬を渡すことができ、(5)参加者も楽しい。

2. VSMの基本的概念と理論的基盤
 VSMでは未来の市場状況を仮想株式で表現し取引させる(正確には株式stocksというより有価証券securities)。時期 T 終了時における出来事 i の状態をZ_{i,T}とし、株式の配当金 d_{i,T} をその可逆な単調変換とする。すなわち
 d_{i,T} = \phi [ Z_{i, T} ]
時点 t における株価 p_{i,T,t} は次のようになる。Z_{i,T} の期待値は、割引率を \delta として
 \hat{Z}_{i,T,t} = \phi^{-1} [ p_{i,T,t} (1+\delta)^{T-t} ]
 VSMの理論的基盤は次の2つ。(1)効率的市場仮説。(2)ハイエク仮説(市場参加者における非対称な情報を累積する最も効率的な仕組みは競争市場における価格メカニズムだ)。
 VSMがうまくいくには以下が要件となる。(1)株式の配当を決めるのがZ_{i,T}だということが明確であること。(2)参加者が未来の市場についてある程度の知識を持っていること。(3)専門家が参加してくれるだけのインセンティブがあること。

3. VSMの設計
 3つの問題にわけ、政治予測市場、実験経済学、金融市場デザインの研究を概観する。

3.1 予測の目標をどう決めるか
 以下の点を決める。(1)Z_{i,T}はなにか。次の3つがありうる。(i)絶対値(例, 売上)。(ii)相対値(例, 市場シェア)。(iii)特定の出来事の生起有無。(2)Z_{i,T}に応じた配当金d_{i,T}。(3)持続期間 T と、その間のVSMへのアクセシビリティ。(4)参加者の制限。

3.2 インセンティブをどう設計するか
 インセンティブは参加者のパフォーマンスによるものにする。次の2つがありうる。(1)参加者に自分の金を投資させる。(2)最初に仮想株式や仮想通貨を渡す。
 ゼロサムゲームにしておかないと胴元が大損するかもしれない。ゼロサムゲームにする方法は2つ。(1) d_{i,T} の i を通じた合計を定数にしておく。Z_{i,T}が絶対値である場合は工夫が必要(幅を持たせて予測させるとか)。(2)参加者の最終のポートフォリオ価値を相対評価する(線形変換、ないしトーナメント)。
 初期ポートフォリオによるバイアス(現状維持バイアス、保有効果)や、リスク志向性の増大がありうるが、あとで現金と引き換えるのなら大丈夫だろう。
 パフォーマンスによらないインセンティブを追加するのもいいかもしれない。

3.3 市場取引ルールをどうするか
 主要な方法は2つ。(1)マーケット・メーカー方式。最初の相場と、相場を注文に応じて変える方法(自動か手動か)を決める。流動性が高い反面、マーケット・メーカーが損する危険もある。(2)ダブル・オークション方式。注文ブックの公開の有無を決める。
 その他、以下の点を決める。(1)ポートフォリオ・ポジションを制限するか(すべてある株に突っ込んでいいかとか)。(2)注文・相場の最高価格・最低価格を制限するか。
 取引手数料や保証金はよろしくないことがわかっている。

4. 実証例: 映画の興行予測

(Hollywood Stock Exchange の分析。省略)

5. 補足例の要約
(ドイツのChart-and-Movie Exchange, ドイツの携帯電話サービス予測市場の分析の要約。詳しくは補足資料を読めとのこと。省略)

6. 結論と将来の研究
 我々の研究はビジネス予測のためのVSMの有用性を示している。
 今後の課題: (1)マネージャーの評価に使う (予測市場で成績の良い奴を出世させるのはどうよ、というような話。殺伐としてきたなあ...)。(2)いろんなデザインの良し悪し。(3)市場の不完全性(例, バブル)。(4)参加者には代表性が必要か、事前にどんな情報を与えればいいか、どんな決定支援システムが効果を持つか。(5)他の手法との併用(例, フォーカス・グループ)。

 頭が整理できた。くそう、去年の書籍原稿の前に読んでおけばよかった。
 著者らはVSMの要件として「配当がZ_{i,T}で決まることが明確であること」というふうに書いているから、HSXみたいに正解がはっきりする予測市場だけが念頭にあるのだろう。正解がはっきりしない奴の研究はまだなかったのかしらん、それともこのレビューに載ってないだけだろうか。

論文:予測市場 - 読了:Spann & Skiera (2003) 仮想株式市場によるビジネス予測

Wertenbrock, K. & Skiera, B. (2002) Measuring consumers' willingness to pay at the point of purchase. J. Marketing Research, 39 (2), 228-241.
incentive-aligned mechanismについて調べていて目を通した論文。Ding(2007, JMR)で引用されていた。著者のSkieraって、予測市場の研究をしている人ではないか。こんなところでつながっているのか。

 購入時点において支払意思金額(WTP)を聴取するいくつかの方法、特にBecker-DeGroot-Marschakの方法(BDM法)とそれ以外の方法を比較しました、という論文。

 まず、WTPを調べる方法についてレビュー。

 実験1と2。

 どちらも、100人を統制群(直接聴取)、100人を実験群(BDM法)に割り振る。実験者が寄ってって声を掛ける:「こんにちは!キール大のリサーチャーです。マーケティングの調査をやってます」。断る人はほとんどいなかったそうだ。課題をやって、最後に質問紙。なお、調査参加報酬については記載がみあたらない。なにも渡さなかったようだ。
 課題は以下の通り。

 実験群のほう、参加者の支配戦略は真のWTPを提案価格にすることである。
 リアリティを追求するので、架空貨幣をつかうとかあらかじめ報酬として金を渡すとか、そういう生易しい話ではなく、ほんとに被験者の財布から金を出させて売りつけるのである。日本でやったら役所に叱られちゃいそうな実験だ。

 結果。WTPの平均はBDMのほうが低い。そのほか「信頼性」「表面的妥当性」「内的妥当性」「基準関連妥当性」の4つに分けて、いろいろ分析してBDMが優れていると主張しているんだけど、いまいち決め手に欠ける感じ。たぶん一番強く推している証拠は、内的妥当性と称されている箇所であろう。それぞれの条件で、横軸にWTP、縦軸に人数をとった累積分布を描く。で、買値で購入確率を予測するロジットモデルを組んで、得られる予測曲線をあてはめると、BDMのほうがフィットしていた由。うーん、それって要するに、WTPの累積分布がBDMのほうでなめらかだった、ということの言い換えのような気がするんだけど。

 想定される批判にお答えして、実験3につなぐ。

 というわけで、実験3。こんどは実験室。被験者は学生255名、商品はボールペン。課題のあとで質問紙。課題は以下の3条件。

 結果。実験1-2と同じく、BDMだとWTPが低めになった。

 云々。

 考察。BDMは優れた方法である。直接聴取のような主観選好法はWTPの過大評価を招く。
 今後の課題。BDMはコンセプト評価には使いにくいし、高価な商品は難しいかも。こうした限界を克服する工夫が必要。とかなんとか。

 要するに、WTPを調べるのにBecker-DeGroot-Marschakの方法が優れている、という主旨の論文である。ふうん、そうですか。
 論文の主旨とはちがうけど、むしろ、あるWTP測定の信頼性・妥当性を示すのがいかに難しいかという点を痛感した。この論文では、たとえばデータを調査の日付で分割し、日付間での変動がBDMのほうで小さい、だから信頼性が高い、なあんてことをやっている(別に日付がノイズになると考えるだけの理由があるわけではないのに)。く、苦しい...それって信頼性の検証の方法としてはどうなの? でも、ほかにいい方法も思いつかない...。
 妥当性のほうも、質問紙の回答からWTPを予測するモデルをつくったら、BDMのほうが係数が有意になった、とかなんとか(もともとWTPの生成について明確なモデルを持っているわけではないのに)。く、苦しい...。でも、ほかにいい方法も思いつかない...。

論文:予測市場 - 読了:Wertenbrock & Skiera (2002) 消費者の支払意思額をくじ引きを使って測定する

2014年4月 7日 (月)

SNSをみてると、新しい生活が始まっていたり、お子さんが生まれていたり、世の中はさまざまな生と死と出来事に満ちあふれているのだが、そのなかで私は静かに他人様の書いた論文をコリコリと読むのであった。コリコリ。

Tziralis, G., & Tatsiopoulos, I. (2007) Prediction markets: An extended literature review. J. Prediction Markets, 1, 75-91.
 予測市場研究レビュー。ずっと前から読もう読もうと気に病みつつ放置していた。このたびめくってみたら、意外に短い内容であった。なんだかなあ。こういうことがあるから、読まなきゃと思ったものは、拙速でもなんでもいいからいったん目を通してしまったほうが良いのである。反省。

いくつかメモ。

論文:予測市場 - 読了:Tziralis & Tatsiopoulos (2007) 予測市場研究レビュー in 2007

2014年4月 5日 (土)

Prelec, D. (2004) A bayesian truth serum for subjective data. Science, 306(15).
 Bayesian Truth Serum (ベイジアン自白剤) を最初に提案した、有名な論文。以前頑張って読んだんだけど、途中で理解できなくなって放り出してしまった。このたび仕事の都合で再挑戦。

 客観的真実がわからない状況で、調査対象者から真実に近い情報を引き出す手法を提案します。
 先行研究:

 著者の基本的なアイデアは、個々の回答にその真実らしさを示す「情報スコア」を与える、というもの。たとえば、まず「過去1年の間にあなたは20人以上とセックスしましたか?」と聴取する。さらに、Yesと答える人は何割いると思いますか、と尋ねる。二問の集計を比較する。たとえば、一問目のYesの集計(Yes率の実態) が10%、このYes回答についての二問目の集計(Yes率の予測)が5%だったとしよう。こういう風に予測より実態のほうが高い回答、つまり"surprisingly common"な回答に、高い情報スコアが与えられる。
 なにいってんだ、という感じですが、著者の説明は以下の通り。

surprisingly common基準は、母集団頻度についてのベイズ推論が持っているこれまで注目されてこなかった含意を利用するものである。[...] ある意見ないし特性の母集団における頻度について、それをもっとも高く予測する人とは、その意見ないし特性を持っている人である。なぜなら、その意見を持っているということ自体が、その意見が一般にポピュラリティを持っているということの、妥当かつ好まれるシグナルになるからだ。[...]

 もう少しフォーマルな説明。
 回答者の正直な答えのことを個人的意見と呼ぶ(実際の回答と一致するとは限らない)。対象者 $r$ に $m$ 個の選択肢のなかからひとつ選ばせる課題で、

 対象者は二問目の回答に際して母集団分布を推測する。未知の母集団パラメータを $\omega = (\omega_1, \ldots, \omega_m)$ と略記するとして、対象者は事前分布 $p(\omega)$ を持っていると考える。これは全員で共通だと仮定し、共通事前分布と呼ぶ。さて、回答者は自分の個人的意見を「非個人的に情報的な」シグナルとして扱い、信念を $p(\omega | t^r)$ にベイズ更新する。個人的意見が同じ時、そのときに限り、2人の人の事後分布は等しくなると仮定する。事前分布・事後分布の形状について全く仮定をおかないところがポイント。

 以下のようにスコアリングする。標本サイズは十分に大きいものとする。

 まず、それぞれの回答カテゴリについて回答を集計する。
 $\bar{x}_k = \lim_{n\rightarrow\infty} (1/n) \sum_r x^r_k$
 $\log \bar{y}_k = \lim_{n\rightarrow\infty} (1/n) \sum_r \log y^r_k$
二問目のほうに$\log$がついているのは幾何平均をとりたいからである。式を何度も見直したが、一問目になんと答えたかは無視して、全員について単純に集計するのである。(ここでどれだけ考え込んだことか...)
 次に、各カテゴリについての情報スコアを求める。
 $\log (\bar{x}_k / \bar{y}_k)$
$k$ 番目のカテゴリを回答した人にはこのスコアを渡す。つまり、
 $\sum_k x^r_k log (\bar{x}_k / \bar{y}_k)$
えーと、「みんなマイナーだと思っているけど実はメジャーな意見」に組した人は高くなるわけか。

 さらに、その人の予測の正確さについてのスコアも求める。
 $\alpha \sum_k \bar{x}_k \log (y^r_k / \bar{x}_k)$
$\alpha$は調整用の正の定数。えーと、カテゴリに対する回答率のその人の予想と実態との比の対数を、実態で重みづけて足しあげた値だ。これ、経験分布とその予測のずれの相対エントロピー(KLダイバージェンス)と比例している由。どうも納得できなくて、いろいろ値を入れて試したんだけど、要するに、ぴったり当てて0, 予測をしくじるほど負の方向に大きくなる。要は適当に予測している人へのペナルティであろう。で、その期待値を最大化するのは $y^r = E(\bar{x}_k | t^r)$とすることである由。真面目にやるのが一番だってことですね。

 各対象者にはこの2種類のスコアの和を与える。みんなが正直に答えているという想定のもとで、正直な回答はこのスコアの期待値を最大化する(ベイジアン・ナッシュ均衡となる)。また、どの対象者においても、情報スコアの期待値をそれ以上に高くする他の均衡解は存在しない。

 この手法を実際に用いる際には、対象者にスコアリングの数理や均衡の概念を説明しなくてもよい。ただ、正直な回答が得点を最大化するということ、個人的な真の回答について考える際には他の対象者がなにをいうかは無視して良いということ、を伝えればよい。ある条件の下でこの主張が誠実であることは均衡分析によって確認されている。云々。

 限界。前提が満たされていないとうまくいかない。すなわち:(1)公的情報が利用可能で、個人的意見が情報的でないとき。たとえば、母集団における女性の割合についての判断には、本人の性別は効かないだろう。フォーマルにいえば、ふたりの $t$ は異なるのに、ふたりの $p(\omega | t)$ がほぼ等しい、という場合である。(2)好みや性質のちがう人が混じっていて、違う理由で同じ答えを示し、しかし母集団についての事後分布は同じ、という場合。つまり、ふたりの $t$ は同じなのに、ふたりの $p(\omega | t)$ が異なる、という場合である。
 その他、$\alpha$ の意義、数値例、他の手法との関係、など。

 うーん... 二回読んだけど、疑問点や理解できない点が山のように出てきた。やっぱり、この論文は難しい。別のを読んでから考え直した方がよさそうだ。

 一番不思議なのは次の点。表面的にいえば、ベイジアン自白剤は「自分の意見と同じ意見を他人も持っている」という認知バイアスを活用する手法だと思う。で、この認知バイアスを説明するために、母集団での意見の分布について全員が同じ事前分布を持っており、自分の意見だけを入力としたベイズ更新を行う、というモデルをつくる。著者が提案するスコアリングはこのモデルに依拠している。そこで疑問なのだけれど、第一に、「自分の意見と同じ意見を他人も持っている」という認知バイアスを説明する方法はほかにないのだろうか。もしもっと優れた説明が可能なら、全然別のスコアの最大化が均衡解になるのではないか。第二に、著者らのモデルを正当化する証拠はあるのか。直感的には、全員が同じ事前分布を持つという想定も、自分の個人的意見だけが入力だという想定も、相当に無理があるような気がするんだけど。
 もっと素朴な疑問もある。この論文では、このスコアを最大化するためには正直に答えることがナッシュ均衡だ、ということが売りになっているのだけれど、それはなにを意味しているのだろう。そのスコアを最大化することを参加者が目指したくなるようなメカニズムを設計すれば、きっとみんな正直に答えてくれますよ、でもそんなメカニズムをどうやってつくるのかは知りませんけどね、ということなのだろうか。
 最後の疑問は、正直なところここに書き留めるのがちょっと恥ずかしいようなナイーブな疑問なのだけれど... この論文に限らないのだけれど、ゲーム理論の概念を使って、この状況下ではこの行動が合理的です、だからこういう風に設計しましょう、という説明を聞くと、いつも狐につままれたような気分になってしまう。人が利用可能な情報を全て使って合理的に行動するとは限らないんじゃない?だって俺はもっと頭悪いよ? と思うからである。この論文についていえば、スコアをインセンティブに直結させるメカニズムをうまく設計したら、本当に人は正直に答えるようになるのか、という疑念がある。

論文:予測市場 - 読了: Prelec (2004) ベイジアン自白剤

2014年4月 4日 (金)

Cayla, J., & Eckhardt, G.M. (2008) Asian brand and the shaping of a transnational imagined community. Journal of Consumer Research. 25. 216-230.
 先日読んだアンダーソン「想像の共同体」がむやみやたらに面白くて、私のなかでブームを巻き起こしてしまい、そのあおりで読んだもの。なにやってんだか。
 アンダーソンいわく、近代国民国家という想像された共同体の成立は、「我が国の言語」による出版資本主義の発達を基盤として可能になった。同様に、国レベルのブランドではなく地域レベルのブランド、たとえば「アジアのブランド」が基盤となって、異なる国の人々のあいだに共通の想像された共同体(「私たちアジア人」)が形成されている。というような主旨の論文。面白いことを考えるものだ。

 シンガポール、上海、シドニー、香港、ハイデラバード、クアラルンプールで働く、マーケティング・マネージャーやプランニング・ディレクターなど、23人にインタビュー。アジア各国で展開しているリージョナル・ブランドの構築に関して取材する。とくに、タイガー・ビールとZujiという旅行ポータルサイトに焦点を当てる。知らなかったんだけど、タイガー・ビールってシンガポールのブランドなのだそうだ。
 で、地域ブランド構築のプロセスを、3つの軸に沿って記述する。
 (1)文化的近接性の構築。それぞれの国の歴史を切り離し、アジア共通の未来のイメージを構築する、というような話。
 (2)ブランドからの場所性の剥奪。どこの国ともしれない、都市的なアジアのイメージを構築する。
 (3)アジア文化のモザイクの創造。たとえば、Zujiというブランド名は北京語でfootprintという意味なんだけど、多くの国ではその音の響きからして日本語だと思われている由。ロゴはモダンな感じにして、色使いはタイっぽくて、タレントはチョウ・ユンファで、タグラインは"Your Travel Guru", これはインドっぽい由。
 
 正直、途中から適当に読み飛ばした。すいません。こういう事例記述って、どう読めばいいのかだんだんわかんなくなってしまうのである。

 本筋とは関係ないけど、Panalozaという人がこんなことをいっているのだそうだ。「消費者研究者たちは、消費者行動研究をマーケティング活動の研究から切り離されたものにしようとするあまり、市場において消費者とマーケターが相互の関係のなかで文化的意味について駆け引きする(negotiate cultural meanings)ありかたが見えなくなっているのではないか」。
 そうそう、これは数年前に講義の準備で消費者行動論の教科書を並べてめくったときに感じたことであった。なんであれディシプリンの成立は抽象化を伴うわけで、抽象化自体を批判するのは筋違いだと思うけど、マーケターの役割をいったん脇において消費者の認知・行動モデルをつくるということについて、消費者行動の研究者の人たちは日頃どう思っているのだろうか、という疑問があった(少なくとも日本では、心理学の観点から消費者行動に関心を持つ人より、マーケティングの観点から関心を持つ人のほうがずっと多いようだから)。やっぱりこういうことをいう人もいるのね。もっとも、この人がどういう人なのかはわからないけれど。

論文:マーケティング - 読了:Cayla & Eckhardt (2008) ブランドによる「想像のアジア共同体」の構築

2014年4月 2日 (水)

Roberts, J.H., Kayande, U., Stremersch, S. (2013) From academic research to marketing practice: Exploring the marketing science value chain. International Journal of Research in Marketing.
 マーケティング・サイエンス(MS)はマーケティング実践にインパクトを与えているか、という実証研究。ただの引用分析ではなく、調査をやっている。妙に面白かった。

 まずフレームワークとして、MSバリュー・チェーンなるものを提示する。それは次の3つの要素からなる。

 ここで仲介者(intermediaries)というのは、リサーチ・ファーム、戦略コンサル、マーケティング・コンサル、企業のMS部門。きっと日本でこの研究やったら、市場調査会社は外されて代わりに広告代理店が入るでしょうね。悔しいのう、悔しいのう(はだしのゲン風に)

 論文もツールも意思決定もたくさんあるので、絞り込みを行う。
 まず意思決定。MSのジャーナルや教科書をみてリストを作り、体系をつくって、実務家や専門家と相談して、次の12エリアに絞った由: ブランド、新製品、マーケティング戦略、広告、プロモーション、価格、販売、営業部隊、チャネル管理、顧客選択、顧客関係、マーケティング投資、品質管理。
 つぎにツール。同じやり方で次の12個に絞る: セグメンテーション、知覚マッピング、調査ベース選択モデル、パネルベース選択モデル、発売前市場モデル、新製品モデル、マーケティング反応モデル、営業部隊配置モデル、顧客満足モデル、ゲーム理論モデル、顧客生涯価値モデル、メトリクス。
 最後に論文。この手続きがすごくしつこくて可笑しいのだが(本文中の数式の本数を数えてみたり、専門家にアンケートしたり...)、要するに、影響力のある論文を100本選び、さらに実務と研究の両方でインパクトがありそうな上位20本を選ぶ。ここ、面白いので、全部挙げます。

ちなみに、研究方面のインパクトと実務方面のインパクトを比べると、研究で高く実務で低い例は、20本には選ばれてないけどMorgan & Hunt (1994)「リレーションシップ・マーケティングの関与-信頼理論」。研究で低く実務で高い例はAaker&Keller (それ、なんとなくわかるなあ...)。どちらでも高い例はGuadagni & Little (1983)。だそうだ。
 上位20本、テーマがかなり重複しているけど、そういうものなのかしらん。同じ著者が複数回でてくるのもちょっと不思議だ(Fornellが3回、KellerやHauserが2回)。案外に研究者の層が薄い世界なんかもしれない。それにしても、いやー、こうやって無責任に高いところから眺めるのはなんだか楽しいなあ。日本の先生方も、ひとつ頑張ってくださいまし。(←大きな態度)

 で、調査。

結果。すごくこまごまと書いてあるので(気持ちはわかる。データ収集大変だったもんね)、ポイントだけ。

 考察。MSは大事な分野でお役にたっている模様です(楽観的な主旨であったか...)。研究者のみなさん、インパクトのある研究を追求するのは悪いことじゃありません。トップ20論文の著者様たちにいわせれば、コンサルティングとの共生、そしてgoing againt the grain at the right time が大事みたいですよ (←良いタイミングで時流に抗する、というような意味合いかしら)。云々。マーケティング・マネージャーのみなさん、本論文をMSの入門資料として役に立ててください。云々。

 というわけで、細かいところは飛ばしてざっと目を通しただけだけど、読み物として楽しく読了。
 感想。実践者が研究者に期待するのは、現在の業務に寄与するfirmな理論的基盤や有用なツールである場合もあれば、通念を揺り動かす斬新な洞察や問題提起である場合もあるだろう。だから、研究者があさっての話をしていると実践家が「いや今日や明日の話をしてくださいよ」と思うこともあるし、逆に研究者がよかれと思って一生懸命すぐに役立ちそうな話をしているのに、実践家が「いや今日・明日のことは我々のほうが良く知っている、中途半端に現実に色目を使った話をしないで、むしろあさって・しあさってのことを考えてくださいよ」と思うこともある。こういう行き違いは実践と研究が接するどの分野でも起きることで、マーケティングも例外ではないと思う。
 この論文は、研究についても実践についても今日・明日のレベルに注目していて、筋が通っていると思う。でもこれとは別に、あさって・しあさってのレベルに注目することもできるのではないか。つまり、MSがビジネスを変えることがあるか、実践家はビジネスの変革に際してMSになにか期待するか... という問題設定もありうると思う。

論文:マーケティング - 読了:Roberts, Kayande, Stremersch (2013) マーケティング・サイエンスはマーケティング実践にインパクトを与えていると思いますか

Millsap, R.E. (2007) Invariance in measurement and prediction revisited. Psychometrika, 72, 4, 461-473.
 あいまいな記憶なんだけど、しばらく前に著者が学会で来日した際、測定不変性と予測不変性はふつう両立しない、これすっごく大事な話なのになぜかみんなわかってない、あたしの論文が難しすぎたんじゃないかと反省している、みんなも反省するようにね、というような内容を喋っておられた。場内は結構盛り上がっていたんだけど、私は前提になっている「大事な話」がよく理解できず、ぽかんとしていた。
 でもそのことはなんとなく心に残っていて、Millsapさんの最近の著書にも目を通したのだけれど、やっぱりこの点についてはよく理解できなかった。このたび整理のついでに、論文のほうに再挑戦。

 指標群Xと潜在変数との間の群間測定不変性と、そのXのなかにはいっている変数同士の回帰モデルにおける係数の群間不変性は、ふつう両立しない、という話である。そういうもんか...
 で、そうなる理由についての説明を小一時間かけて頑張って読んだけど、学力不足のせいか、なにか見落としているのか、やっぱりどうしても理解できなかった。一行一行は難しい話ではないのに。とても残念だ。

 でもまあ、この論文の主旨はあの講演と同じく「すでにこのことを指摘してるのになんでみんな理解してくれないの」という点にあるので(難しいからだと思いますよ、先生!!)、前の論文を読めばきっとわかるのであろう。そう信じたい。Millsap(1995, MBR), Millsap(1998, MBR) というあたりを読めばいいらしい。でも、すいません、とりあえず他の著者のを探します。

論文:データ解析(-2014) - 読了:Millsap(2007) 測定不変性と予測不変性は両立しないことをなぜみんなわかってくれないのかしら

« 2014年3月 | メイン | 2014年5月 »

rebuilt: 2020年11月16日 22:42
validate this page