elsur.jpn.org >

« 2012年8月 | メイン | 2012年10月 »

2012年9月29日 (土)

Howell, W. (2011) CBC/HB, bayesm and other alternatives for bayesian analysis of tradeoff data. Proceedings of Sawtooth Software Conference 2011, 355-364.
 仕事の都合で目を通した。コンジョイント課題の実データ,maxdiff課題(best-worst課題)の人工データと実データを用い、階層ベイズ法による個人効用推定をいくつかのソフトで試して比較しましたという報告。コンジョイント分析のソフトで知られるSawtooth社のユーザ会発表資料。著者はHarris Interactive社のえらい人。
 ソフトは、Rのbayesmパッケージ、WinBUGSとOpenBUGS、Sawtooth社のCBC/HB、そしてHarrisのソフト(HIhbmkl)。計算速度、モデルの対数尤度、ホールドアウトでのヒット率などを比較する。
 Rではbayesm::rmnlIndepMetrop()を使っている(名前からして,独立連鎖メトロポリス・ヘイスティングス・アルゴリズムで多項ロジットモデルを推定する関数であろう)。なんでrhierMnlRWMixture()を使わないのかと思ったら、CBC/HBはむしろrmnlIndepMetrop()に近いらしい。そうなんすか? 難しくってよくわかんないや。
 CBC/HBがもうぶっちぎりで速い由。それはいいとしても、対数尤度やヒット率が結構違うというのにびっくり。怖いなあ。

論文:データ解析(-2014) - 読了:Howell (2011) CBC/HB とそのライバルたち

福元圭太 (2009) 魂の計測に関する試論:グスターフ・テオドール・フェヒナーとその系譜(1). かいろす, 47, 33-48.
福元圭太 (2011) フェヒナーにおけるモデルネの「きしみ」 : グスターフ・テオドール・フェヒナーとその系譜(2). 言語文化論究, 28, 1-21.
福元圭太 (2012) 『ツェント・アヴェスター』における賦霊論と彼岸 : グスターフ・テオドール・フェヒナーとその系譜(3) 言語文化論究, 28, 121-134.

 勤務先での仕事の都合でたまたまFechnerの名前を目にする機会があり(一対比較データの分析方法について調べていたため)、このFechnerって、心理学の教科書に出てくるヴェーバー・フェヒナーの法則の、あのフェヒナーだよねえ...と、なんとなくぼんやり検索していて、日本語で書かれたフェヒナーの評伝(!)を見つけ、思わず読みふけってしまった。ここまで来ると、仕事とはもう何の関係もない。
 掲載誌は九大の紀要。著者は独文の先生で、ワタシ高校で数IIまでしかとってないんで数式のところはさっぱりわかんないです、などと注のなかでこっそりぼやきつつも、実験心理学の祖にして汎神論的な思想家でもあったフェヒナーの、いまでは誰も読もうとはしないであろう膨大で晦渋で冗長な著述を、延々と辿っていくのである。ご苦労様でございます。

 著者いわく、19世紀ドイツにおいては「『実証主義的自然科学』と『ロマン派の観念論的自然哲学』との間に葛藤が生じることとなったのだが、[...]これこそがフェヒナー個人の中で起こっていた葛藤に他ならない」「極端な言い方をすれば、両者の葛藤の擬人化こそがフェヒナーなのである」のだそうである。ふうん。
 33歳で物理学の正教授となったフェヒナーは、肉眼で太陽を見つめる実験のせいで目を傷めたのをきっかけに、「やがては顔を布で覆い、最後には顔全体にブリキの仮面をかぶるようになって極端に光を避け、黒く塗られた部屋に閉じこもって4年に近い月日を過ごすことに」なった。いや、それってもう眼の病気じゃないですよね。
 で、なぜか突然に回復したのちは神秘主義的な自然哲学にシフトし、なぜ植物に魂がないといえるのでしょうかとか、地球にも天にも魂があるんだとか、死後の魂は神の精神圏に入るんだとか、そういう感じの本を山ほど発表し、同時代の人々からうんざりされたり無視されたりする。現代の心理学科の学生はたいてい一年生の時に、感覚量そのものじゃなくて弁別閾を測るんだという精神物理学の基本概念を教わるけれど、あれをフェヒナーが最初に発表したのは、そうした忘れられた著作の片隅だったんだそうである。へえええ。

 論文3本を費やしつつも、伝記としてはいまだ完結に至っていない。続きをお待ちしております。

論文:その他 - 読了:福元 (2009,2011,2012) フェヒナー先生とその時代

どうも精神的に余裕がなくて,新書くらいしか読めない日々が続いている。困ったものだ。

Bookcover 原発危機 官邸からの証言 (ちくま新書) [a]
福山 哲郎 / 筑摩書房 / 2012-08-08

Bookcover 北朝鮮と中国: 打算でつながる同盟国は衝突するか (ちくま新書) [a]
五味 洋治 / 筑摩書房 / 2012-09-05

Bookcover 神道とは何か - 神と仏の日本史 (中公新書) [a]
伊藤 聡 / 中央公論新社 / 2012-04-24

ノンフィクション(2011-) - 読了:「神道とはなにか」「北朝鮮と中国」「原発危機・官邸からの証言」

2012年9月25日 (火)

Goldstein, W.M., Barlas, S., Beattie, J. (2001) Talk about tradeoffs: Judgments of relative importance and contingent decision behavior. in Weber, E.U., et al.(eds.) "Conflict and tradeoffs in decision making." Campridge University Press.
 属性の相対的重要性判断についての自分たちの実験研究(2つ)を紹介。
 先に読んだGoldstein(1990)で,選好順序づけ課題や属性重要度評定課題と一緒に「他者の選択からその人の属性重要度を推定する」という奇妙な課題がスルッと登場していて,ちょっと違和感があった。そういう課題が必要だという論理的辻褄はあわせてあるんだけど,なんでそんな課題を思いついたのかが分からない,という感じ。いっぽうこの論文では,そもそも我々は「誰かに自分の代わりに選択してもらう」というような意思決定にまつわるコミュニケーションに関心があります,その手段としての重要性評定に注目しております,その基盤となる「相対的重要性」概念の素朴解釈について調べます,そのための手段として他者信念推測という課題を用います... というストーリーになっている。なるほど。

 著者らいわく,相対的重要性には次の2つのプロトタイプがある。ひとつはrelative sensitivityで,属性の水準の変化が望ましさに及ぼす影響のこと。たとえば限界代替率(MRS)がそうである。もうひとつはrelative impactで,刺激の望ましさにその属性が寄与している程度のこと。
 著者らは,相対的重要性評定がこのどちらに偏るかが選好の反応モードによって変わる,という仮説を持っている。具体的には,選好を順位づけで表すと選択肢間の比較が促進され,相対的重要性はsensitivity寄りになる。選好を価格で表すと選択肢の単一評価が促進され,相対的重要性はimpact寄りになる。。。んじゃないかしらん,という仮説である。

 実験材料は,ゲーム・ショーの賞品セット。フロリダのビーチ・リゾートへのご招待,現地で使えるクーポンつき。長さとクーポン金額が異なる。

著者らの説明は次の通り。ここ,ちょっと微妙な論点を含んでいると思うので,訳出しておく。

たいていの人にとって,小さな金額を100ドル増額することによる望ましさの増大は,大きな金額から100ドル増額することによる望ましさの増大よりも大きい。従って,セットCの賞品の間での選好は,他のセットと比べて金額(の変化)に対するsensitivityが低くなるはずである。もし人々が相対的重要性をrelative sensitivityの観点から解釈しているのであれば,クーポン金額の相対的重要性はセットCで小さく,セットAで大きいと判断されるはずである。いっぽう,望ましさの変化ではなく,望ましさの全体的な大きさについて考えると,セットCの賞品は金額が大きいので,他のセットよりもより望ましい。つまり,セットCの金額は商品の望ましさの程度により貢献している(絶対的にみても,日数と比べても)。従って,もし人々が相対的重要性をrelative impactの観点からとらえていたら,金額の相対的重要性はセットCで大きく,セットAで小さいと判断されるはずである。

おおっと。これは先に読んだGoldstein(1990)の,相対的重要性のglobal解釈とlocal解釈の区別とは違う話だ。global/localというのは,相対的重要性が刺激セットに依存するかどうかという話であった。いっぽうここでいうsensitivity/impactというのは,刺激セットからの独立性を問わず,属性の単位当たり変化が選択肢にもたらす変化がsensitivityであり, 各選択肢の全体効用そのもの(変動ではない!!)に占める属性の部分効用がimpactなのだ。Achen(1982)による重要性概念の分類と比べると,sensitivityはtheoretical importance, impactはlevel importanceに相当するといえよう。

 しかしこの分類でいくと,Goldstein(1990)が採っていたもう一つの解釈も可能なのではないか。つまり,relative importanceは刺激セット内での選択肢の効用の分散に対する属性の寄与を表す,という解釈である(Achenのいうdispersion importance)。この場合でも,金額の相対的重要性はセットAで大きくなるはずだ。。。

 それはともかく,実験1の課題は以下の通り。

  1. 練習課題で刺激に慣れる。
  2. 課題a. 各セットについて,選好を回答し(後述),2属性への相対的重要性を評定する(100ポイントのアロケーション)。
  3. 課題b. 架空の人物("Sue"さん)の選好を教示され(後述),Sueの相対的重要性評定を推測する。

実験条件は,選好回答(教示)のモード。選択肢の順位づけ,ないし,最低売出価格の設定。被験者内で操作する。従って,課題a.は6試行,課題b. は2試行になる。なお,Sueさんは結構合理的な人で,選好順序と売り出し価格はほぼ加算的に決まっており,反応モードによる選好逆転なんぞはない。金額のrelative sensitivityはセットAで大きく,relative impactはセットCで大きくなるように組んである。
 主な結果は...

実験2では,材料は同じで,反応モードを被験者間で操作する。ついでに,Sueが答える最低売出価格を,上下にいろいろずらしている(被験者間4水準)。結果は...

考察:仮説は支持できなかったけど,ともかくも,選好を人に伝える際のモード(順位か値付けか)によって,そこから推論される相対的重要性が変わってくる,ということが示された。云々。

 個人的には,「他者の選好からその人にとっての相対的重要性を推論する」という話はどうでもよくて,むしろ,人は自分の選好を支えている構造について答えられるか?できるとしたらいつどうやって?という点に興味がある。著者らはこの点については中立的で,いろいろ議論してくださっているけど,要するに,さあ知らないね,とのことである。さいでございますか。
 この実験で一番面白い知見は,選択肢への選好を順位づけでなく価格設定で表明させると,選好そのものは選択肢の金額属性に対してinsensitiveになるのに,相対的重要性評定は金額属性重視側にずれる,という点だと思う。刺激反応適合性の観点からいえば,金額属性と価格設定課題は尺度的な適合性があるから,価格設定課題においては選好であれ重要性評定であれ金額属性sensitiveにならないとおかしい。この点についても,いろいろ考えたけどどうもよくわからんなあ,とのことであった。うむむむむ。
 というわけで,どうももやもやした内容であったのだが,ま,勉強になったので良しとしよう。

論文:調査方法論 - 読了:Goldstein, Barlas, & Beattie (2001) 「彼女にとって愛とお金のどっちが大事か」を我々はどのように推測するか

2012年9月24日 (月)

Goldstein, W.M. (1990) Judgments of relative importance in decision making: Global and local interpretations of subjective weight. Organizational Behavior and Human Decision Process, 47, 313-336.
 相対的重要性の主観評定を求めた際、回答者は重要性という概念をどのように解釈しているか、という研究。数年前からこの種の研究を延々探しているんだけど、重要性の測定手法研究は多々あるものの、こういうのは案外みあたらないのである。この論文は、すっかり読んだ気になっていたが、チェックしたら実はまだ読んでなかったことが判明、慌てて目を通した。

 学生に架空の賃貸アパート物件のセットを呈示する。属性はたったのふたつ: 月額賃料とキャンパスからの距離。物件のセットは2つあって、wideセットでは「$500で5分」「$450で10分」...「$250で30分」の6つ、narrowセットでは「$400で5分」「$380で10分」...「$300で30分」の6つ。wideセットのほうが金額の幅がwideである。セット内では属性間に完全な負の相関がある(5分あたり、wideでは$50、narrowでは$20下がる)。
 各被験者は各セットについて3つの課題を行う(計6課題)。

 主な結果は:

 で、考察。主観的重要性についての4つの立場を紹介し、この実験結果との整合性について論じる。

 簡単な実験を組みわせてロジックをアクロバティックに組み立てていく、絵に描いたような実験研究であった。素直に考えれば、自分の選択(課題A)と他者の意図の推定(B, C)とではそもそもメカニズムがちがうんじゃなかろうかと思うのだが、こうロジカルに詰め寄られると、反論は難しくなる。俺はこういうの嫌いじゃないけど、人によっては、ケッ、と思うだろうな。

 要するに、属性の主観的重要性評定は選択肢セットから独立ではなく、選択肢集合におけるその属性の分散をも反映する、ということであろう。結論だけだとアタリマエに聞こえるが、実験で示したところが偉い。

論文:調査方法論 - 読了:Goldstein(1990) 「お金と愛情とどちらが大事ですか?」「選択肢によりますね」

2012年9月20日 (木)

Shu, L.L., Mazer, N., Gino, F., Ariely, D., Bazerman, M. (2012) Signing at the beginning makes ethics salient and decreases dishonest self-reports in comparison to signing at the end. Proceedings of the National Academy of Sciences, 109(38).
 ある方のtwitterの呟きで知った論文(感謝...)。記名式の1p調査票で、記名欄が下にあるよりも上にあるほうが正直な回答が得られる、という実験研究。楽しいなあ。
 自分の名前を書くという行為が正直さ概念を活性化させるからだ、という説明。ご丁寧に潜在課題(語彙完成)で証拠を添えている。
 回答が正直かどうかをどうやって押さえたんだろう、と興味を引かれて目を通した。パズルをやらせ、その正解数に応じた報酬を与えるのだが、実は税金の関係で金額がちょっと目減りしちゃうんです、別室で還付してますんでよろしくと伝える。で、別室で再度、じゃあこの紙にあなたの先ほどの正解数をご記入ください、という手続き。その紙の記名欄の位置を操作する。なるほど。
 倫理性を活性化させる手続きは、自分の名前を書かせる他になにかないかしらん? 今度調べてみよう。

 よくみたら、著者にアリエリーが入っている。この人は実在するのだろうか。面白い研究を発表する際には連名にアリエリーという架空の名前をいれるという決まりかなにかがあるのではないか。

論文:調査方法論 - 読了:Shu, et al. (2012) お名前記入欄は最初に

2012年9月19日 (水)

読了というより,最後までめくった,という表現が正しいのだけれど....

Bookcover ベイズモデリングによるマーケティング分析 [a]
照井 伸彦 / 東京電機大学出版局 / 2008-09
この本,書店に並んだばかりの頃に,ろくろく中身を確かめずに買い込み,帰路に開いてみたら,薄い本だが中身は難しそうな数式だらけ。帯には「統計数理が消費者行動分析の最先端を切り拓く」なあんて,とても魅力的な文言が踊っているのだが,これでは素人にはとてもじゃないが理解できない。やれやれ,買った私が悪うございました,勝手に切り拓いてくださいな,と悪態をついて書棚にしまい込んでいた。
 それからはや数年。このたび必要に迫られ,名著と名高い Rossi, Allenby, McCulloch (2005) "Bayesian statistics in marketing" を読み始めたのだが,ターヘル・アナトミアよろしく一行一行解読を試みても,あまりに難解で歯が立たない。ほとほと疲れ切って書棚を眺め,ふとこの本を手に取ったら! なんと分かりやすい,親切な書き方だろうか! 以前は呪文のようにさえみえた数式が,スルスルと頭に入って来るではないか。
 緒言によれば,これはRossi et al. と同じテーマを,しかし「彼らによる著書よりも読者層を広げて読みやすく」扱うことを目的とした本だったのだ。先生,誠に申し訳ありませんでした。自分の能力不足を著者のせいにするの,やめます。
 というわけで,Rossi et al. よりも道具立てを絞って平易に書き下ろされたこの本のおかげで,少しは前進できた。この本の内容をすべて理解したとは言い難いし,実をいうと最終章の分析事例で俄然話が難しくなり挫折してしまったのだが,いや!もう文句は申しません!それはどうせ私の頭が悪いからです,ええ!
 とにかく,著者の先生に感謝,日本語でこういう本が読めることに感謝。

Bookcover Rによるベイズ統計分析 (シリーズ 統計科学のプラクティス) [a]
照井 伸彦 / 朝倉書店 / 2010-03
上記の本を読んでいて,そもそも基礎がよくわかってないことに気づき,いったん中断してめくった本。動学的ベイズモデルの章は難しすぎてスキップ。
 もうちょっとRのコード例が載ってたら,もっと助かったんですが... いや!文句は申しません!

データ解析 - 読了:「ベイズモデリングによるマーケティング分析」「Rによるベイズ統計分析」

Bookcover 道元―自己・時間・世界はどのように成立するのか (シリーズ・哲学のエッセンス) [a]
頼住 光子 / 日本放送出版協会 / 2005-11
哲学者としての道元禅師についての入門書。あまり真剣に読んでなかったせいだとは思うが,時間論のところからさっぱりわかんなくなってしまった。。。

Bookcover ハイデガー拾い読み (新潮文庫) [a]
木田 元 / 新潮社 / 2012-08-27
ハイデガーの講義録を題材にした啓蒙読み物。

Bookcover 南無阿弥陀仏―付・心偈 (岩波文庫) [a]
柳 宗悦 / 岩波書店 / 1986-01-16
なんでかしらないが,ここんとこ,仏教書づいているなあ。。。
 かの柳宗悦さんが,浄土思想について在家の立場から熱く語る本。法然から親鸞を経て一遍へ,というある種の進歩史観に立っているところが,面白いといえば面白いし,妙な感じだとも云える。

哲学・思想(2011-) - 読了:「道元」「ハイデガー拾い読み」「南無阿弥陀仏」

Bookcover 検証 福島原発事故 官邸の一〇〇時間 [a]
木村 英昭 / 岩波書店 / 2012-08-08

Bookcover 地域を豊かにする働き方: 被災地復興から見えてきたこと (ちくまプリマー新書) [a]
関 満博 / 筑摩書房 / 2012-08-06

Bookcover ネットと愛国 在特会の「闇」を追いかけて (g2book) [a]
安田 浩一 / 講談社 / 2012-04-18
ファナティックなレイシズム的言辞で悪名高い,かの在特会についてのノンフィクションの労作。そのメンバーはしかし,どこにでもいる普通の人々なのである。ううむ。。。

Bookcover お葬式―死と慰霊の日本史 [a]
新谷 尚紀 / 吉川弘文館 / 2009-01-30

ノンフィクション(2011-) - 読了:「地域を豊かにする働き方」「お葬式」「ネットと愛国」「官邸の100時間」

Bookcover 惑星スタコラ(1) [a]
加藤 伸吉 / 講談社 / 2009-10-23
Bookcover 惑星スタコラ(2) [a]
加藤 伸吉 / 講談社 / 2011-12-20
Bookcover 惑星スタコラ(3) [a]
加藤 伸吉 / 講談社 / 2012-08-21
最近読んだマンガの大ヒット作。 昭和の香りのする日常風景とアール・ヌーヴォー調の異様な風物とが混在した奇怪な世界を舞台にした,壮大な悪夢的ファンタジー。とても面白い。
 著者は大昔に「国民クイズ」という原作つき作品の作画をしていた人。その後数冊アーティスティックな短編集を出しているのを見かけたが,あまり印象に残らなかった。2006年からこの作品を連載していたらしい。全然気がつかなかった。
 主人公を襲う野生の「野良重機」なる怪物は,暗闇を両生類のようにバタバタと走り回るショベルカーで,長い腕で作業員を掴んではコクピットに押し込み,棘皮で身体を粉砕して消化してしまう。夢に見そうだ。

Bookcover 20歳は過ぎたけれど 『ママはぽよぽよザウルスがお好き』リュウ&アン成人編 [a]
青沼貴子 / メディアファクトリー / 2012-08-24

Bookcover 犬神姫にくちづけ 1巻 (ビームコミックス) [a]
宮田紘次 / エンターブレイン / 2012-09-15

Bookcover シュトヘル1 (BIG SPIRITS COMICS SPECIAL) [a]
伊藤 悠 / 小学館 / 2009-03-30
Bookcover シュトヘル 3 (BIG SPIRITS COMICS SPECIAL) [a]
伊藤 悠 / 小学館 / 2010-07-30
Bookcover シュトヘル 2 (BIG SPIRITS COMICS SPECIAL) [a]
伊藤 悠 / 小学館 / 2009-10
チンギス・ハンの時代に材をとった歴史ロマン。これ,面白いなあ。

Bookcover 路地恋花(4) <完> (アフタヌーンKC) [a]
麻生 みこと / 講談社 / 2012-09-07
シリーズ最終巻。中学生の一人娘の初デートを心配性の父親が尾行するのを手伝う羽目になる女性の話が良いと思った。

コミックス(2011-) - 読了:「惑星スタコラ」「20歳は過ぎたけれど」「犬神姫にくちづけ」「シュトヘル」「路地恋花」

Bookcover ペコロスの母に会いに行く [a]
岡野 雄一 / 西日本新聞社 / 2012-07-07
認知症の母との心の交流を描くコミックエッセイ,なのだけれど,途中で時空が入り乱れるダイナミズムがあって,読み手の心を揺り動かす。長崎のミニコミ誌などで少しづつ発表されてきた作品だそうだ。これは,すごい。。。

Bookcover ラビッツカンカン [a]
安倍 夜郎 / 学研パブリッシング / 2012-08
ヒット作「深夜食堂」の著者が,デビュー前に描きためていたという前衛的な四コマ作品。森田拳次のひとこまマンガを思い出した。これはこれで面白いけど,「深夜食堂」がなかったら絶対に単行本化されなかっただろう。

Bookcover よるくも 3 (IKKI COMIX) [a]
漆原 ミチ / 小学館 / 2012-08-30

Bookcover オーイ・メメントモリ 完全版 (MFコミックス) [a]
しりあがり 寿 / メディアファクトリー / 2012-08-23

Bookcover くるみのき! 2 (BUNCH COMICS) [a]
青木 俊直 / 新潮社 / 2012-06-08

Bookcover サルチネス(1) (ヤンマガKCスペシャル) [a]
古谷 実 / 講談社 / 2012-09-06

コミックス(2011-) - 読了:「ペコロスの母に会いに行く」「Rabbits CanCan」「よるくも」「オーイ・メメントモリ」「くるみのき!」「サルチネス」

Bookcover 腕~駿河城御前試合~ 1 (SPコミックス) [a]
森 秀樹,南條 範夫 / リイド社 / 2011-06-28
Bookcover 腕~駿河城御前試合~ 2 (SPコミックス) [a]
南條 範夫 / リイド社 / 2011-12-26
南條範夫「駿河城御前試合」はなんども映像化・漫画化されているが,これはその最新作。著者はかつて小学館で酒見賢一原作「墨攻」を連載していた人だと思うが,本作ではリイド社らしい正調の劇画タッチである。
 原作の短編連作を先日読んで,「がま剣法」という短編が抜群に面白いと思ったのだが,この漫画化でもちゃんと採り上げている。先行する漫画化と比較してみると,翻案の個性がはっきり現れて面白い。森秀樹描く下級武士「がま」は絶望に苦しむ青年だ。平田弘史描く「がま」は疎外と差別に抗い抜き,もはや階級社会への孤独な抵抗者と化している。山口貴由描く「がま」に至っては,最初から人間でない。

Bookcover あさひなぐ 6 (ビッグ コミックス) [a]
こざき 亜衣 / 小学館 / 2012-08-30
高校なぎなた部の女子高生たちを描く,心正しき熱血青春スポーツマンガ。

Bookcover カラスヤサトシの日本びっくりカレー (ウィングス・コミックス) [a]
カラスヤ サトシ / 新書館 / 2012-08-25
実在のカレー屋さんを紹介するコミックエッセイ。なにも買わなくてもよかったんだけど...

Bookcover 思ってたよりフツーですね (3) (単行本コミックス) [a]
榎本 俊二 / 角川書店(角川グループパブリッシング) / 2012-07-25

Bookcover オールラウンダー廻(9) (イブニングKC) [a]
遠藤 浩輝 / 講談社 / 2012-08-23
総合格闘技に青春を賭ける青年たちを描く。この人のマンガはデビュー作からリアルタイムで追いかけているので,ついつい甘くなってしまうのだけれど,この緻密な試合シーン,マンガならではの快感があると思う。

Bookcover 高校球児ザワさん 10 (BIG SPIRITS COMICS SPECIAL) [a]
三島 衛里子 / 小学館 / 2012-08-30

Bookcover 岳 18 (ビッグコミックス) [a]
石塚 真一 / 小学館 / 2012-08-30
小学館の旗艦誌「ビッグコミック」の主力連載,ついに最終回。これだけ引っ張っちゃったら,こういう終わり方しかないかもなあ,とため息。お疲れ様でした。

コミックス(2011-) - 読了:「岳」「腕・駿河城御前試合」「思ってたよりフツーですね」「あさひなぐ」「高校球児ザワさん」「オールラウンダー廻」

バタバタしている時には論文など読めないし,従ってメモも取れないが,不思議なもので,根を詰めて論文を読みあさっているときも,なにやら面倒に感じてメモをとれなくなる。これは何日か前に書きつけていたものだが,他に何を読んだのか思い出せない。困ったものだ。

Little, R. (2006) Calibrated Bayes: A Bayes/Frequentist roadmap. The American Statistician, 60(3), 213-223.
 良く知らないけど、著者は偉い人だと思う (Little & Rubin のLittleであろう)。Rubinたちは統計学での古典的な頻度主義アプローチとベイジアン・アプローチとを融合したcalibrated bayesianアプローチというのを唱えているのだそうで、それを紹介した論文。大会の招待講演が基になっているようで、変なイラストがついていたりして、楽しい。
 ここでいう頻度主義とは、未知パタメータΘについての仮説検定なり信頼区間なりを、反復抽出下での統計量の分布から引き出そうとする立場のこと。ベイジアンとは、データについてのなんらかのモデルとΘの事前分布に基づき、Θの事後分布についての推論をしようとする立場のことで、事前分布をどう基礎づけているかはこの際問わない。漸近的な最尤推論はベイジアンに分類される由(Θの区間を信頼区間ではなく信用区間として捉えているから)。
 著者いわく、たいていの統計学者はその場その場で役に立つほうのアプローチを採ればいいやと考えており、2つのアプローチに橋渡しをしようとは思っていない。でもアナタ、アプローチが2つあるということは誠に困ったことなのですよ、と著者は多数の事例を挙げて説得にかかる。たとえば平均の区間推定で、n=7 で標本平均が 1、SDが 1 だったとき、95%信頼区間は母分散未知として 1±0.92, 母分散 1.5 として 1±1.11 だが (ジェフリーズ事前分布を用いたベイズ信用区間もそうなる)、「母分散が1.5より大」であることが既知の場合、それを生かした信頼区間の求め方はわからない(ベイズ信用区間なら 1±1.45)... などなど。
 それぞれのアプローチの長所と短所を整理すると... 頻度主義アプローチの短所として以下の点が挙げられる:

  1. prescriptiveでない。たとえば「最小二乗の原理」というのは、推論手続きの特性評価をしてくれるだけで、推論システムそのものを一般的に提供してくれるわけではない。
  2. 不完全である。ベーレンス・フィッシャー問題を見よ(等分散性が仮定できない二群の平均の差の正確な信頼区間は求められない)。
  3. あいまいである。2x2クロス表の独立性の検定では、ピアソンのカイ二乗検定、イエーツ補正つき検定、フィッシャーの正確検定があって、使い分けに明確な合意がない。
  4. 尤度原理に反する(尤度が同じなら含まれている情報も同じだ、という原理に反する)。コインを投げて表が出る確率をΘとする。「12回投げる」実験で3回表が出たら、尤度は L ∝ Θ^3 (1-Θ)^3。「3回表が出るまで投げ続ける」実験が12回で済んだ場合、尤度はやっぱり L ∝ Θ^3 (1-Θ)^3。ところがΘ<1/2を対立仮説とした片側検定の正確 p 値は、前者と後者で異なる(前者は二項分布、後者は負の二項分布から求めるから。おおお、気づかなかったー)。

 いっぽうベイジアンアプローチの短所としては以下の点が挙げられる。なお、「確率の定義と事前分布の選択が主観的だ」というよくある批判に著者は同意しない(頻度主義アプローチだって場合によっては主観的だから)。

  1. モデル(尤度関数と事前分布)を完全に指定しないといけない。
  2. 提供される答えが多すぎる。つまり、事前分布次第で答えが大きく変わってしまう。
  3. モデルがまずいと答えもまずい。頻度主義アプローチの場合、特性の良い手続きを探すということがモデルの誤指定に対するある程度の予防となっているわけだが、ベイジアン・アプローチの場合、モデルを間違えたら一巻の終わりである。そしてモデルというものは、多かれ少なかれ常に間違っているものだ(ここで層別抽出についての簡単で面白い事例を紹介)。過激な主観ベイジアンならばそれも良しとするところだろうが、科学的推論に対するアプローチとしてはちょっと厳しい。それにそういう人たちだって、実際にはデータをこっそり覗き見してからモデルを決めてんじゃじゃないですかね、とのこと。ははは。

 さて、calibrated Bayesianとは... 頻度主義者はモデル形成と評価に強く、ベイジアンはモデル下での推論に強いんだから、両方をいいとこどりしましょう、というアプローチである。Box(1980)という人はこう定式化しているのだそうだ:
p (Y, Θ | M) = p (Y | M) p (Θ | Y, M)
右辺第2項のp (Θ | Y, M)、すなわちデータYとモデルMの下でのパラメータΘの事後分布が、パラメータ推論の基盤となる。第1項の p (Y | M) の検討、すなわちモデルMの下でのデータYの周辺分布の検討が、Mのチェックを意味する(ここで頻度主義の考え方が導入される)。この両方が大事なわけだ。
 といわれてもピンとこないけど、実例としては... 2x2クロス表の独立性の検定の場合、結局はベイズ信用区間を出すんだけど、ジェフリーズ事前分布を採用して良かったかどうかをフィッシャーの正確検定でチェックする (ええー???)。平均の区間推定の場合、結局はベイズ信用区間を求めるんだけど、ジェフリーズ事前分布を採用して標本分散の事後予測分布を出し、手元の標本分散が得られる確率がそれに照らして低すぎないか検定する(ええー???)。などなど。
 最後に、calibrated Bayesの立場からの統計教育への提言: 修士課程でベイズ統計を必修にしなさい。統計手法よりも統計モデリングを重視しなさい。モデル適合度の評価にもっと注意を向けなさい(フィッシャー流の有意性検定を含む)。

 実例のくだり,胡瓜の酢のものをクリームシチューにいれましょうなんて云われたような感じで、面食らったのだけど。。。要するに、基本的にはベイジアン、でも尤度関数と事前分布のチェックの際には頻度主義的アプローチもアリ、という立場であろう。

論文:データ解析(-2014) - 読了:Little (2006) 古典的統計学とベイズ統計学の折衷派宣言

« 2012年8月 | メイン | 2012年10月 »

rebuilt: 2020年11月16日 22:45
validate this page