elsur.jpn.org >

« 読了:Yang & Goldfarb (2015) マッチング理論でみたスポーツチームのスポンサー契約 (または: 酒メーカーのロゴを選手のシャツから締め出したら困るサッカークラブはどこだ?) | メイン | 読了:Binder (2015) 回答におけるキリの良い数字に注目して確信度を測定する »

2016年1月26日 (火)

Camerer, C.F., Ho, T.H., Chong, J.K. (2004) A Cognitive Hierarchy Model of Games. The Quartarly Journal of Economics, 119 (3), 861-898.
 私にはよくわからないが、行動ゲーム理論というのだろうか、そういう分野では有名な論文らしい。しばらく前に読んだScienceのレビュー論文で紹介されていて、興味を惹かれて手に取った。
 正直いって私ごときの歯が立つ代物ではないのだが(掲載誌は経済学のトップジャーナル)、まあ何事も経験だよな、と目を通した次第。いいじゃん、素人が何を読んだってさ。

1. イントロダクション
 たとえば美人投票ゲーム。参加者に0から100までの数字を挙げさせ、回答の平均の2/3に一番近い数字を挙げた人に賞品を与える。参加者にとっての合理的で整合的な選択はゼロだ。なぜなら、均衡理論によれば参加者はこう考えるはずだ:「仮に他のすべての参加者の推測値が100だとして、答えるべき値は67だ。他の参加者もそう考えるだろうから、答えるべき値は45だ。他の参加者もそう考えるだろうから...突き詰めると答えるべき値は0だ」。しかし実験では、回答の平均はたいてい20から35くらい。
 たとえばビジネス参入ゲーム。n 人の参加者に、需要 d の市場に参入するかどうか決めさせる(dはnより小さい)。参入者の人数がd以下だったら参入したほうがよくて、そうでなかったら参入しない方が良い、というようにペイオフを設定する。均衡理論によれば、参入する人数は d に近くなるはずである。実験すると、確かにそういう結果になる。
 このように、均衡理論による予測は当たらない場合もあれば当たる場合もある。この違いはなぜ生まれるのか?
 それではご紹介しましょう、認知階層理論(cognitive hierarchy model)です!

2. ポワソンCHモデル
2.1 決定ルール
 認知階層理論では、ゲームのプレイヤーたちが以下のグループに分かれると想定する。[←話の先取りになるけど、以下でいうステップ数とは「他者の選択について何手先まで読むか」というような概念である。]

...以下続く(ただし、人数はどんどん減っていく)。
つまり、$k$ステップ・プレイヤーが持つ、他者に占める$h$ステップ・プレイヤーの割合についての信念$g_k(h)$は、すべての$h \geq k$について $g_k(h)=0$。人は「俺だけが他の奴らより一手先まで読んでいるぜ」と過信しちゃうものだ、という想定である。

 さらにこう想定する。$k$ステップ・プレイヤーの信念$g_k(h)$は、自分よりステップ数が少ない人におけるステップ数の相対的割合について正確である。つまり、実際の頻度を$f(h)$として、$g_k(h) = f(h) / \sum_{l=0}^{k-1} f(l)$。$k$が増大すると$g_k(h)$と$f(h)$のずれは小さくなる。[←2ステップ・プレイヤーは「2ステップ・プレイヤーはこの俺様だけだ」と考え、3ステップ以上のプレイヤーが存在するとは夢にも思わない。その点で彼は間違っているのだが、0ステップ・プレイヤーと1ステップ・プレイヤーの相対的サイズに限って言えば、彼は実際の分布を知っている。ということであろう]

 プレイヤー $i$ が$m_i$個の戦略を持っているとしよう。$j$番目の戦略を$s_i^j$と書く。彼が$k$ステップ・プレイヤーだとして、彼がその戦略を選ぶ確率を$P_k (s_i^j)$と書く。別のプレイヤー$-i$が持っている戦略が$s_{-i}^{j'}$であるときのペイオフを$\pi_i (s_i^j, s_{-i}^{j'})$と書く。
 戦略$s_i^j$のペイオフの期待値は、彼のステップ数を$k$として下式となる。
 $E_k (\pi_i (s_i^j)) = \sum_{j'=1}^{m_{-i}} \pi_i (s_i^j, s_{-i}^{j'}) \{ \sum_{h=0}^{k-1} g_k(h) \cdot P_h(s_{-i}^{j'})\}$
 [←いやいや、ここで諦めてはならん。さあ深呼吸!
 k=2として考えよう。まず、相手$-i$の選ぶ戦略が$j'=1$である場合について。そのときのペイオフは$\pi_i (s_i^j, s_{-i}^{1})$。では相手が$j'=1$を選ぶ確率は? 相手は確率$g_2(0)$で0ステップ・プレイヤーであり、戦略$j'=1$を選ぶ確率は$P_0(s_{-i}^1)$。相手は確率$g_2(1)$で1ステップ・プレイヤーであり、戦略$j'=1$を選ぶ確率は$P_1(s_{-i}^1)$。あわせて考えると、相手が$j'=1$を選ぶ確率は $g_2(0) \times P_0(s_{-i}^1) + g_2(1) \times P_0(s_{-i}^1)$。
 オーケー、じゃ次は相手の選ぶ戦略が$j'=2$である場合について考えよう... というわけだ。なるほどね、この式で合っている]

 各プレイヤーはどのように戦略を決めるか。以下のように仮定する。
 0ステップ・プレイヤーには戦略的思考がない。彼はある確率分布に従って戦略を選ぶだけだけである。ここでは一様分布に従うとしよう。彼が戦略 $j$ を選ぶ確率は $P_0 (s_i^j) = 1/m_i$である。
 1ステップ以上のプレイヤーは期待値が最大の戦略を選ぶ。すなわち $P_k(s_i^*) = 1$ iff $s_i^* = argmax_{s_i^j} E_k (\pi_i (s_i^j))$。もし期待値最大の戦略が複数あったらランダムに選ぶ。

 こうして、プレイヤーのステップ数の分布$f(0), f(1), \ldots$が与えられれば、順に戦略の選択確率$P_0(s_i^j), P_1(s_i^j), \ldots$を算出できるわけだ。これをCHモデルと呼ぶ。

2.2 $f(k)$の分布
 さて、$f(k)$の分布をどうやって手に入れるか。
 ひとつの方法は、ステップ数の最大値を適当に決めてデータから最尤推定するという方法。著者らはこれまでこの方法を試してきた。だいたい0,1,2ステップまで考えればよいことがわかっている。
 もうひとつは、分布にパラメトリックな仮定を置く方法。ステップ数は作業記憶に制約されるから、大きくなるほど人数が減るとみてよいだろう[←サラッと強気な仮定を置くねえ...]。$f(k)/f(k-1)$が$k$に反比例すると考えると、$f(k)$はポワソン分布 $f(k) = \exp(-\tau) \tau_k / k!$だ。パラメータは$\tau$のみ。この仮定でも$f(0), f(1), \ldots$を自由推定するのと同じくらいの適合が得られることが、これまでの研究でわかっている。これをポワソンCHモデルと呼ぶ。

3. ポワソンCHモデルの理論的特性
3.1 支配-可解ゲーム (dominance-solvable games) [←支配される戦略を逐次削除すると最後に戦略の組が一つだけ残る、という意味らしい]
 ポワソンCHモデルによれば、$f(k-1)/f(k-2) = \tau(k-1)$だ。$\tau$が大きな値であるとは、$k$ステップ・プレイヤーが「ほぼ全ての他者が$k-1$ステップ・プレイヤーだ」と考えることを指す。
 [ここから私には難しかったので、ほぼ全訳]

ポワソン分布の持つこの特性は、思考のステップを被支配戦略の繰り返し削除と結びつけるかんたんなやりかたを提供する。まず、1ステップ思考者は弱被支配戦略を選ばないだろう。なぜなら、0ステップ・タイプのランダム戦略への反応として、これらの反応は決して最良でないからだ。さて、$\tau$が非常に大きいと想定しよう。このとき、2ステップ思考者は、(ほとんど)すべてが1ステップ思考者で、ごく一部が0ステップ施行者であるような相手とプレイしているかのようにふるまう。1ステップ思考者はすでに弱被支配戦略を削除しており、0ステップ思考者はランダムである。こうして、2ステップ思考者は、強被支配戦略をプレイしないだろうし、他の人が弱被支配戦略プレイを削除したあとで弱被支配である戦略もプレイしないだろう。この論理を拡張すると、被支配戦略を好きなだけ繰り返し削除できる。なぜなら、kが$\tau$より十分小さい限り、kステップ思考者はあたかも他の人がすべてk-1ステップ思考者であるかのようにふるまうだろうからである。

[←被支配戦略が逐次削除されて解が決まるという話と、他の人はほぼすべてk-1ステップ・プレイヤーだと思ってしまうという話との論理的関係がつかめないんだけど、これは私の知識不足のせいなので、いずれは理解できる日も来るだろう...]
 さらに次の性質がある[証明がついているけど略]:kステップ・プレイヤーが(純)均衡戦略をプレイするならば、それより高いステップのプレイヤーもそうなる。したがって、$\tau$→ $\inf$ とすると、ポワソンCHモデルによる予測は、弱被支配戦略を繰り返し削除して到達されるナッシュ均衡へと収束する。

3.2 協調ゲーム [CHモデルは複数の均衡を持つゲームにおける均衡選択をうまく説明できる、という話。略]
3.3 市場参入ゲーム [なぜ市場参入ゲームの結果は均衡解に近いのかという説明。略]

4. 推定とモデル比較
 ポワソンCHモデルをいろんなゲームの実験データにあてはめてみよう。
4.1. 美人投票ゲーム。先行研究における24の美人投票ゲームにモデルをあてはめそれぞれの$\tau$を算出する。平均してだいたい1.5くらい。ただし、均衡がどこかとか、教育程度とか、報酬とかでちょっと変わってくる。
4.2. $\tau$はどのくらい一定か。[略]
4.3 どのモデルがもっともよくあてはまるか。あるパネルにいろんなゲームをさせた先行研究データを使う。ポワソンCHモデルはデータによくあてはまる。同じパネルでもゲームごとに$\tau$が動くと考えるともっとよくあてはまる。いっぽうナッシュ均衡は全然あてはまんない。云々。
4.4 ゲームを通じた予測。同一のパネルに複数回ゲームをさせたデータで、一部のゲームをホールドアウトしてポワソンCHモデルをあてはめたとき、同じ$\tau$でホールドアウトをうまく説明できる、という話。
4.5 事例。[略]

5. 理論の経済的価値
 あるプレイヤーの立場になってシミュレーションしてみると、ナッシュ均衡解に従うよりもCHモデルの予測に従ったほうが期待される利得が大きい。云々。

6. 戦略的思考の限界が持つ経済学的含意
6.1 投機
 合理性が共通知識であれば、リスク回避的プレイヤーはヘッジング以外の投機的行動をしないはずだ。これをグルーチョ・マルクスの定理という。[←なぜそう呼ぶのだろう?]
 実際には投機は始終起きる。CHモデルはこれをうまく説明できて...[略]
6.2 マネー・イリュージョン
 インフレの時に収入と価格を調整しそこねること。たとえば、4人一組のゲームで、プレイヤーに1から30までの整数を選ばせる。これが価格。ペイオフは自分の価格と、残り3人の価格の平均の組み合わせで決まる(プレイヤーに30x30のペイオフ表を示す)。「他の人より高い価格を云うと儲かる」というルールの場合と、「他のプレイヤーと一致する価格を云うと儲かる」というルールの場合について調べる。前者では価格は戦略的代替(substitutes)となっており、後者では価格は戦略的補完(complements)となっている。なお、どちらのルールでもナッシュ均衡は11か14になっている。実験データでは、代替の場合のプレイヤーの答えは均衡に近いが、補完の場合には22から23になる。これはポワソンCHモデルでうまく説明できる。[←元のゲームの構造が理解できていないので、残念ながらまるごと理解できない。元のゲームは、どうやら「字面の数字の大きさに引っ張られる」バイアスを示すゲームらしい。面白そうだなあ]

7. 結論
 ワンショットのゲームでは、$\tau$はだいたい1.5くらいと思われる。
 今後の課題: (1)$\tau$を内生変数にする[endogenize. いかにも経済学者っぽい言い方だなあ。普通の言い回しでいえば「$\tau$がどういうときにどういう値になるのかを説明する」であろう]。これは認知制約のもとでもう一手余計に考えることの限界利益の問題であろう。(2)プレイヤーに信念を述べさせる、脳イメージング、情報検索、反応時間、などによる研究。(3)不完全情報ゲームへの拡張。(4)実際の経済行動への適用。
 
 いやー、これは!!超面白かった!!
 どこが面白いといって、規範モデルをちょっとだけ手直しして、すごく説明力のある記述モデルをつくる、というところ。CHモデルのプレイヤーは期待効用を最大化する合理的経済人なのだ。ただちょっぴり頭が悪くて(?)、他人の戦略を読む手数が限られているだけなのである。いやあ、こういうの、痺れるなあ。
 さらに面白いのは、比較的に単純なミクロ・モデルに個人差を取り入れることで、マクロにみると複雑な現象をうまく説明しているところ。大昔にL.Lopesの「プロスペクト理論がなくたってリスク志向性の個人差を考えればリスク下意思決定の複雑な現象がうまく説明できる」という論文を読んでいたく感動したことがあるんだけど(若かったなあ)、あの感銘を思い出した。

 でもそのいっぽうで、読んでてすごく気持ち悪かったところもあって...
 モデルが現実と比べて単純だというのは当然のことなので、細部をあげつらって「この仮定は現実的でない」といっても仕方がないんだけど、著者らはステップ数の限界を認知的な制約(作業記憶による制約)として述べているわけだから、ほかの部分でも、認知的にあまりに不自然な仮定を置くのは宜しくないと思う。この論文を読んでいて一番気持ち悪かったのは、「2ステップ・プレイヤーは2ステップ・プレイヤーが自分しかいないと誤解しているが、0ステップ・プレイヤーと1ステップ・プレイヤーの相対的サイズについてだけは正しく知っている」というところ。なんでそんなふうに、わざわざ認知的基盤が想像しにくい仮定を置くんだろう? あるゲームに参加したとき、他のプレイヤーがどのくらいアホか、僕らはどうやって知ることができるんだろうか。
 むしろ、最初から「ステップ数の共通事前分布があり(正しいとは限らない)、各プレイヤーは自分自身のステップ数をシグナルにしてそれをベイズ更新する」ようなモデルを考えたほうが、ずっとリアルな感じがするし、かえってシンプルに推定できちゃったりしないのかなあと思うんだけど... そんなことないのかなあ。

 もうひとつ、この感想もきっと専門の方には馬鹿にされちゃうだろうと思うんだけど... 作業記憶制約のせいでステップ数に限界が生じるっていうんなら、なんでもっと直接的な証拠を探さないの、先生!とイライラしながら読んでいた。プロトコル分析すればいいじゃん。ゲームの参加者の口元にマイクつけて、ずっと独り言いってもらいながらプレイしてもらえば、個々の参加者が何手先まで読んでる人か分かったりするんじゃない? そこまでいかなくても、せめて反応時間くらい調べようよ! さらにいえば、無関係な数字を暗唱する並行課題かなんかで作業記憶を妨害しながらプレイしてもらったときの選択確率の変化が、CHモデルにおけるステップ数の減少として記述できるとかさ、そういう実験やろうよ先生! と...
 幸いこういう行動実験の話は、論文の最後のところでちらっと触れられていたので、全くやらないってわけでもないんだろう。Camerer, Prelec, & Loewenstein (forthcoming, Scandinavian J. Econ.), Rubinstein(2003, Working Paper), Chong, Camerer, & Ho (in press, incollection), Costas-Gomes & Crawford (2004, Working Paper)というのが挙げられていた。

 というわけで、途中で「キタキタ...」「おおおーっ」などと小声で呟いたりしつつ、しばし楽しいひとときを過ごしたのだけれど、あいにく当面の仕事には役に立ちそうにない。なにやってんだかなあ。

論文:心理 - 読了:Camerer, Ho, & Chong (2004) ゲームの認知階層モデル