« 読了:Piazza, Sniderman, & Tetlock (1989) 相互作用的な調査手法 by 政治学者 | メイン | 読了: Schlack (2012) "予測市場" by communispace社 »
2015年3月 5日 (木)
Healy, P.J., Linardi ,S., Lowery, J.R., Ledyard, J.O. (2010) Prediction Markets: Alternative Mechanisms for Complex Environments with Few Traders. Management Science, 56(11), 1977–1996.
掲載誌が体質に合わないので後回しにしていたんだけど、M先生のレビューで意外な形で取り上げられているのに気づき、念のために本文を2pほどめくってみたら... もっと早く目を通すべきだった、と大後悔。何もかもひとりでやっているからしょうがないんだけど、それにしても要領が悪すぎる。
いわく。ダブル・オークション(DA)が予測市場のうまい仕組みだというのはわかっている。でもそれはIEMみたいな大規模市場のときの話であって、企業内市場でも最適かどうかはわからない。そこで、参加者が3人の状況で(!!!)、DA, iterated polling (デルファイ法みたいなもの。以下IP)、パリ・ミュチュエル(PM)、そしてHansonのマーケット・スコアリング・ルール(MSR)を比較しました。
最初に結果を先取りして紹介。参加者数が多い単純な状況ではDAがおすすめ。アイテム数が多いとか、予測する事象が相関しているとか、参加者数が少ないといった状況ではIPがおすすめ。IPはsubsidy paymentsが必要だという欠点があるけど(胴元が自腹を切らなきゃいけないってことね)、人数が少なけりゃ問題にならないでしょ。
行動の観察でわかったこと。(1)市場操作の試みはDAとPMで観察された。(2)IPとMSRでは支払総額がsubsidizeされているので参加者のやる気も増す。(3)参加者はほっとくと一部の証券にしか注意を向けない。IPはこの点で有利。(4)ヘンな参加者のせいで影響を受けるのはPMとMSR。IPは大丈夫。
先行研究。
- 参加者数の影響について。価値ある情報を持たない参加者(ノイジー・トレーダー)が増えると市場の効率性が下がるという話と(Delong et al., 1990 J.Finance), 情報を持っている参加者が利益を売る機会が増えるので情報の獲得・統合が進むという話がある(Kyle, 1985 Econometrica)。観察研究・実験研究ともに結果はmixed。
- 情報が複雑だとどうなるか。Arrow-Debreu証券市場で、私秘情報が比較的に単純で、私秘情報を全部累積すれば必ず真の状態がわかるのであれば、市場は効率よく収束することがわかっている(Plott & Sunder, 1988 Econometrica)。配当が複雑になったり、不確実性が増えたりすると話が変わってくる。云々。
- この論文ではすごく単純な環境を扱うけど(後で出てくるけど、状態は2^3=8しかないし参加者はたった3人)、そういう先行研究としては、
- McKelvey & Page(1990 Econometrica)のIPの実験。
- Chen et al.(2001 Conf.)の実験、コールマーケットとかよりpollが良いという結果。
- Plott et al.(2003 Econom. Theory)、PMの実験。
- Thaler & Ziembda (1988 J.Econom.Perspect), PMを支持。
- MSRは理論研究はいっぱいあるけど、実験はLedyard et al.(2009 J.Econom.Behav.Organ.)のみ。
この実験で使う環境を定義します。さあ、歯を食いしばれ!
世界の状態は2次元からなっている、ということにします。次元1は観察不能な因子で、観察可能な次元2に影響する。参加者は次元1を、そしてこれからの次元2を予測する。たとえば、次元1は中央銀行の金融政策、次元2は公定歩合、というような感じ。
具体的にはこういう課題。コインを選んで投げる。予測対象はオモテが出る確率。次元1がコインのバイアス、次元2が出目だ。
コイン$\theta$を確率分布$f(\theta)$からドローする。$\theta$の空間を$\Theta$とする。ドローしたコインを投げ、出目$\omega$を条件つき確率分布$f(\omega | \theta)$からドローする。$\omega$の空間を$\Omega$とする。
エージェント$i$は$\omega$についての$K_i$個の独立なシグナル $\hat\omega^i = (\hat\omega^i_1, \hat\omega^i_2, \ldots, \hat\omega^i_{K_i})$を私秘的に観察している。エージェントは$\omega$の真値を知ろうとし、事前分布$f(\theta), f(\omega | \theta)$を$\hat\omega^i$でベイズ更新して、まず事後分布$q(\theta | \hat\omega^i)$を得る(以下$q^i(\theta)$と略記)。で、さらに事後分布$p^i(\omega) = \sum_{\theta'} f(\omega | \theta') q^i(\theta')$を得る。OK?
メカニズム設計者の目標は、個々のエージェント($I$人)の信念を集約することだ。いちばん簡単なケースは、設計者がすべてのエージェントの私秘シグナルを観察できるケースである(完全情報のケース)。$\omega = (\hat\omega^1, ..., \hat\omega^I)$のもとでの$\theta$の事後分布$q(\theta | \hat\omega)$を$q^F(\theta)$と書くとして、出目の完全情報事後分布は
$p^F(\omega) = \sum_{\theta'} f(\omega | \theta') q^F(\theta')$
さて、設計者が実際に作った集約メカニズムによるパフォーマンスをどう評価するか。時点$t = (0,1,\ldots,T)$における事後分布$h_t$を「ランニング事後分布」、$h_T$を「出力分布」と呼ぶことにする。すべての$\omega$を通した、$h_T(\omega)$と$p^F(\omega)$のズレの二乗を合計すればよい。いいかえれば、出目$\omega$の空間$\Omega$における$h_T$と$p^F$のユークリッド距離を求めればよい。(式省略)
準備はできた。用意する環境はふたつ。かんたんなやつと複雑な奴。
かんたん環境。コイン$\theta$の空間を$\Theta = \{X, Y\}$、出目$\omega$の空間を$\Omega=\{H, T\}$とする(headとtailね)。$f(X)=1/3, f(H|X) = 0.2, f(Y)=2/3, f(H|Y)=0.4$とする。
複雑環境。コインは$X, Y, Z$の3枚、ランダムな順に並べて取り出す(これを$\theta$とする)。よって$\Theta$は6要素ある。$f(\theta)=1/6$。で、それぞれのコインを投げ、その結果(たとえばHHT)を出目とする。よって$\Omega$は8要素。$f(\omega | \theta)$は結構複雑で、えーと、$X$がオモテになる確率が0.2, $Z$がオモテになる確率が0.4, $Y$が$X$と一致する確率が2/3。だからたとえば$f(TTT | XYZ) = 0.32$となる、という... そんなもん推測できないよ、参加者のみなさんも大変だ。
どちらの場合も、エージェント$i$はコイン$\theta$も出目$\omega$も観察できず、ただ出目のサンプル$\hat\omega^i$だけを観察できる。
市場参加者のペイオフは、ほんとは$\omega$の実現値に基づいて決めるべきところだが、そうすると運の良し悪しが出てきちゃう。参加者にわかりやすいように、主催者だけが知っている正しい$f(\omega | \theta)$からわざわざ500回ドローした経験分布$\phi(\omega)$をつくり、これに照らしてペイオフを決める。要するに、たとえばかんたん環境では、「正解を発表します!500回投げたらオモテは350回、ウラは150回です!」っていう風に正解を発表する、ということなんだろうな。
お待たせしました、選手入場です!
- ダブル・オークション。かんたん環境では2枚、複雑環境では8枚の出目株を売り出す(Arrow-Debreu証券)。スタート時のキャッシュなし、空売り有り。市場が閉じると個々の出目株($\omega_s$とする)に対して$\phi(\omega_s)$が開示され、これを単価として清算。[←あれれ? Arrow-Debreu証券って、取引価格を変動させ、ペイオフを1ドルとかに固定する証券のことじゃないの? こういう量的結果をペイオフする線形証券であっても、とにかく配当が外的に決まっていればArrow-Debreu証券というのだろうか...]
- パリ・ミュチュエル。かんたん環境では2枚、複雑環境では8枚の$\omega$チケットをすべて1ドルで販売。ペイオフはオッズと真の確率の積。つまり、チケット$s$の販売枚数を$T_s$として、$(T_s/\sum_\omega T_\omega)^{-1} \times \phi(\omega_s)$。
- iterative poll。つまりはインセンティブつきデルファイ法。まず、参加者に出目の確率分布を申告させる。その算術平均をとって全員にフィードバック。また確率分布を申告させ、平均をフィードバック... これを5回繰り返す。5回目の平均を出力分布$h_T(\omega)$とする。ペイオフは全員に対して同じで、対数スコアリング・ルールで決める[←そういうことか!うわー、これ、面白い!!!]。すべての参加者に、各状態$s$について、$ln(h_T(\omega_s)) - ln(1/S)$の「チケット」を渡す。そのチケットを$\phi(\omega_s)$で精算する。[えーと、たとえばかんたん環境で、最終ラウンドでのオモテの予測確率が0.4だったら、$ln(0.4)-ln(0.5)=-0.22$枚の「オモテチケット」、$ln(0.6)-ln(0.5)=+0.18$の「ウラチケット」が渡されるわけだ。で、「正解発表!オモテ60%、ウラ40%です!」となったら、オモテチケットを-0.22x0.6=-0.13ドルで清算、ウラチケットを0.18x0.4=0.07ドルで清算して、結局みんな仲良く-0.06ドルの損、ということであろうか]
- マーケット・スコアリング・ルール(MSR)。各状態$s$について$h_0(\omega_s)=1/S$とする。ランニング事後分布$h_t$を毎度公表する。参加者が証券$s$を売買するたび、
$ln(h_{t+1}(\omega_s)) - ln(h_t(\omega_s))$
を受け取る...というか、上の式x-1が売買価格になっている。最後に$\phi(\omega_s)$を配当。
実験。
被験者はCaltechの学部生。3人ずつ組ませる(これをセッションといっているらしい)。全16セッション。実験は16ピリオド、1ピリオドは5分間。
2つの環境で4つのメカニズムを比較するから、要因は2x4。詳細は略するが、各セッションは2x4=8の各セルのうち2セルを担当し、各セルについて8ピリオドの市場に参加する。
。。。と、ここまでメモをとりながら丁寧に読んだが、時間切れ。あとはメモなしでざっと通読した。全体にIPを支持する結果であった。
論文:予測市場 - 読了:Healy, et al. (2010) 対数スコアリングルールで報酬を与えるデルファイ法はひょっとすると予測市場よか気が利いてるかも