elsur.jpn.org >

« 2016年7月 | メイン | 2016年9月 »

2016年8月26日 (金)

 ほんとはいまそれどころじゃないんだけど、前に取ったメモを忘れないうちに記録しておく。(現実逃避)

McEntegart, D.J. (2003) The pursuit of balance using stratified and dynamic randomization techniques: An overview. Drug Information Journal, 37, 293-308.
 実験研究で対象者を条件に割り付けるとき、無作為割り当てに頼っていてよいか? 重要な共変量については標本設計の段階で条件間できちんとバランスさせておいたおいたほうがよいのでは?それはなぜ?そしてどうやって?... という話題があって、その医薬統計向け解説。医学分野での実験では、多施設で同時に実験するとか、対象者が徐々に増えていくとか、そういう特有の事情があって、案外話題が尽きない模様なのである。
 雑誌の性質はよくわからないが、NACSISで所蔵館17館だから、そんなに妙なものではないだろう。現誌名はTherapeutic Innovation & Regulatory Science となっているらしい。

 以下、内容メモ。

 標本設計の段階で予後因子[共変量のことね]を条件間でバランスさせるのはなぜか。

 バランスを保ちつつ無作為割り当てする方法。

 手法選択における考慮ポイント。

 分析について。厳密に言えばrerandomization testをやるのが正しい。著者もFDAにそう命じられたことがある。いっぽう、対象者参加順の時間トレンドがない限り、バランスさせた要因を分析に含めれば、標準的な検定でよいという意見もある。こっちのほうが多数派で、シミュレーションで支持する報告もある。当局にrerandomizationで検定しろって突っ返されるのがどうしても嫌だったら別だけど、黙って標準的検定をやってりゃいいんじゃないでしょうか。
 云々。

 。。。この話、市場調査にすごく縁の深い話なんだけど、これまでにきちんとした解説をみたことがない(たいていの市場調査の教科書は社会調査のアナロジーで書かれており、統制実験という視点が乏しいからだと思う)。また、詳しくはちょっと書きにくいけど、実査現場でものすごく奇妙な慣習が横行している領域でもある。これは実査側の問題でもあり、発注側の問題でもあるので、いつかきちんとまとめたいものだ。。。(現実逃避)

論文:データ解析(2015-) - 読了:McEntegart (2003) 共変量の分布をバランスさせつつ実験条件に対象者をうまく割り当てる方法レビュー

2016年8月25日 (木)

Surachartkumtonkun, J., Patterson, P.G., McColl-Kennedy, J.R. (2013) Customer rage back-story: Linking needs-based cognitive appraisal to service failure type. Journal of Retailing, 89(1), 72-87.
 ちょっと都合があって目を通した論文。魅力的なタイトルだが、要するに横断研究である。

 いわく。
 顧客の激怒とその帰結についての研究はあるけど、激怒にいたるまでのバック・ストーリーに注目した研究は少ない。わずかに、激怒は人間の基本的要求(正義とか自尊心とか)のハンドリングのミスによって生じるという理論研究があるくらいだ。サービスの失敗から激怒に至るまでの認知的評価(cognitive appraisal)プロセスと、そのプロセスに影響する諸要因について調べる必要がある。
 本研究ではストレス・コーピングの理論に基づいて、認知的評価とサービス失敗の関係を調べる。注目するのは、最初の失敗(エピソード1)とリカバリの失敗(エピソード2)。顧客は西洋人(US)と東洋人(タイ)。 キー・クエスチョンは次の2つ。(1)サービス失敗のタイプと、激怒に至る認知的評価の関係。(2)文化はその関係のモデレータになっているか。

 ここから理論的議論。長い。めんどくさい。

 Affective event theory(AET; Weiss & Cropanzano 1996)によれば、出来事の認知的評価が感情を引き起こす。その感情価は自分のwell-beingに対してそれが脅威か利益かという知覚で決まる。[←AETって知らなかったけど、要はラザルスの認知的評価理論の組織研究版みたいなものらしい]
 ストレス・コーピングの理論によれば、人はネガティブ感情反応において不均衡状態を感じ、コーピングにより通常の状態へと復帰しようとする。コーピング戦略には問題焦点型と感情焦点型がある。激怒はコーピング戦略のひとつと捉えられる。

 話変わってサービス失敗について。大きくわけて初期失敗とリカバリ失敗がある。失敗のタイプとしては、核心的失敗、従業員の鈍感な行動(無能さを含む)、不適切な行動(無礼とか)、遅延、非倫理的行動、にわけられる。[←さすが、すでにこういう分類があるのね。Bittner, et al.(1990 J.Mktg.), Keaveney (1995 J.Mktg.)というのが挙げられている。]

 認知的評価とネガティブ感情について。
 人間の基本欲求への脅威は強いネガティブ感情を引き起こす。激怒につながる脅威として以下が挙げられるだろう:資源欲求への脅威(カネと時間)、自尊欲求への脅威、公平性知覚の欲求への脅威、制御欲求への脅威、安全欲求への脅威。

 文化について。人は世界の理解において文化モデルに依存する。[...Hofstedeの文化次元の話。いまちょっとそういう気分じゃないのでパス...]

 そんなこんなで、以下の仮説が導かれる。(安全欲求への脅威はレアだろうから、仮説には出てこない)

 データ。
 過去半年以内にサービス失敗で激怒した覚えのある人に、その経験の詳細な自由記述を求めた。サービスの業種は問わない(ホテルとかデパートとか)。バンコクで212名、US西海岸で223名。回答をエピソード1, 2にわけ、 結局、全体でエピソード1が435例、2が415例となった。あらかじめ用意したコーディング・フレームによって、5タイプの失敗、5タイプの脅威へとコーディングした。
 [フレームはアプリオリに決めたよ、と何度も強調している。おそらく、ここがこの分野でこの定性的アプローチを押し通すための鍵なのだろう。コードの体系をデータから立ち上げていくやり方だと相手にされないんだろうな、きっと]

 分析。
 エピソード1,2別に、4つの脅威の発生を従属変数とし、階層ロジスティック回帰モデルを計8本組んだ。独立変数は、失敗タイプ(エピソード1では5つ、エピソード2では核心的失敗を除く4つ)、国、国と失敗タイプの交互作用、そのほか対象者属性。失敗タイプはエピソード内で重複していて排他分類できないんだそうで(そりゃそうだよな。無能かつ無礼な店員というのが存在しうる)、全部ダミー変数になるので、結構でかいモデルになっている。
 [恥ずかしながら、なぜ「階層」ロジスティック回帰なのかがよくわからない。だってこれ、一人一票でしょ? たしかに国で階層化されたデータではあるけれど、モデル上は国の効果と国x失敗タイプの交互作用をいれただけじゃないのかなあ]
 結果は... エピソード2のH2, H4a, エピソード1のH8を除きすべて支持された由。[正直、結果には全然関心ないので、ちゃんと読んでない]
 ロジスティック回帰じゃなくてPLSモデルでも再現できた由。

 考察。[...略...]
 実務への含意としては、失敗のリカバリにあたって顧客の心的・経済的な損失に合致したオファーを出すことが大事でしょう。自尊心の脅威を感じているんなら謝罪して傾聴して支援するとか。公平性に脅威を感じているんなら説明するとか。実のところ、顧客が何をどう認知的に評価してるかなんてわかんないけど、失敗タイプからあたりがつけられるんじゃないでしょうか。遅いと不満を云っている→資源脅威だ、みたいに。
 云々、云々。

 。。。要するに、顧客はなぜ激怒するか?それは人間としての基本欲求に対する脅威を認知したからだ。という枠組みに基づく研究である。その枠組みのなかでは、面白い研究なんだろうな、たぶん。なかなか文化間比較なんてできないっすよね。自由記述でコーディングってのも手間がかかっている。

 いまこの瞬間にも、電話口や店先では顧客が激怒し、従業員はなにもできずただ歯を食いしばって頭を下げていることと思う(親鸞聖人は正しい。地獄は一定すみかぞかし)。その激怒のうち、この論文で想定されているようなクールな激怒(認知的評価理論があてはまるような激怒)って、果たして何割くらいなんだろうか。認知的評価より感情的反応が先行しちゃってる場合もあるだろうし。俺はとにかくまず怒鳴る男だ!理屈は怒鳴りながら考えるぜ!という行動先行型の激怒もあるだろうし。そもそも病気の人もいるだろうし。
 個別具体的に顧客に向き合うサービス実務最前線の人にとっては、その判別こそが最大の関心事だろうと想像するのだが、さすがにその割合は、サービスの性質や環境要因で変わってきちゃうので、一般化できないんでしょうね。

論文:マーケティング - 読了:Surachartkumtonkun, et al. (2013) 顧客の激怒のバック・ストーリー

Masson, M.E.J., A tutorial on a practical Bayesian alternative to null-hypothesis significance testing. Behavioral Research Methods, 43, 679-690.
 先日目を通した Wagenmakers(2007 PB&R) に基づく、手取り足取りなチュートリアル。要するに、p値じゃなくて2つの仮説のBICの差を見ましょう、なぜならそれを2で割るとベイズ・ファクター(BF)の対数の近似になるから。という話である。
 いくつかのANOVAについて計算例を手取り足取り示している。

 あまりに眠くて眠くて、数行ごとに意識を失った。途中からは目がつつつーっと滑っていく感じ。ろくに読めていないが、整理の都合もあるし、今回はご縁がなかったということで、読了にしておく。

 ひとつだけ、あれ、と思った点をメモしておくと...
 かんたんなANOVAのBICは、誤差の正規性を仮定すれば
 $BIC = n \log (1-R^2) + k \log(n)$
 と書けるが、ここでの$n$とはなにか。素直に考えるとデータサイズだが、反復測定ANOVAのときには話がややこしい。対象者数$s$, 条件数$c$として、独立な観察数は$n=s(c-1)$だからこれを使おうという意見と、$s$を使おうという意見がある由。そういや、Wagenmakersさんもそんなことを書いていたな...。著者は前者を採用している。

 こうしてBFをBICで近似するのは、まじめに周辺尤度を求めるのが大変だからだろうと思う。でも、BICの差は必ずしもベイズ・ファクターの良い近似にならないはずなので、もし特定の適切な事前分布の下で解析的にベイズ・ファクターが出せるんなら、そっちのほうが気が利いていると思うんだけど。ANOVAでは無理なのだろうか。そこについての言及はとくになかったと思うが、見逃している可能性も高い。

論文:データ解析(2015-) - 読了:Masson (2011) p値はやめてBICの差を使いなさい:実践編

Jamil, T., Ly, A., Morey, R.D., Love, J., Marsman, M., Wagenmakers, E.J. (2016) Default "Gunel and Dickey" Bayes factors for contingency tables. Behavioral Research Methods.
 先日たまたまベイズ・ファクターについて考える機会があって、そういえばクロス表のベイズファクターの事前分布って、あれどうなってんの?と気になった。ちょっと探してみたら、先月公開された解説記事が見つかった。第三著者はRのBayesFactorパッケージの中の人。こりゃラッキーだ、というわけで、ざっと目を通した。

 クロス表の独立性の検定のためによく使われる手法は、カイ二乗検定、尤度比検定、フィッシャーの正確検定である。しかし[...ひとしきりp値の悪口...]。
 本論文では、ベイズ・ファクター(BF)による仮説検定について説明しよう。この手法、実は長い歴史を持っているのだが、先行研究のほとんどは、統計的洗練のレベルが高い人々とか、古い数式記号フェチの人々とか、プログラミングやデバッグが目的の人々にしか相手にされてこなかった。[←そう書いてあるんです、私が言っているんじゃないです]

 ほんとは古典的統計学の場合でもそうなんだけど、標本抽出デザインについて考えないといけない。クロス表の標本抽出デザインとして次の4つを区別できる。

 いったんクロス表の話から離れて、ベイズファクターについての説明。[...略...]
 なお、Jeffreyの解釈基準[BF>10が「強い証拠」だというような早見表]の有用性については、本論文の著者のあいだでも意見が一致していない。[←面白いコメントだ]

 クロス表のBFについてはGunel&Dickey(1974 Biometrika)が定式化している。ここからは彼ら(GD74)の議論を追いかける。
 $R \times C$のクロス表$y_{**}$を考える。$r$行$c$列の頻度を$y_{rc}$とする。
 事前パラメータの行列$a_{**}$を考える。サイズは $R \times C$で, $r$行$c$列のパラメータを$a_{rc}$とする。このパラメータってのは、あとで出てくるけど、ガンマ分布なりディリクレ分布なりの形状パラメータのこと。
 行と列が独立しているというモデルを$H_0$, 独立でないというモデルを$H_1$とし、この2つのモデルを比較するベイズファクターを定式化する。

 というわけで、いずれの抽出スキームでも、$a_{**}$があればBFが出せる。(正確にいうと、ポワソン抽出スキームの場合は尺度パラメータ$b$が必要だけど、GD74が$b$の決め方を提案してくれている由)。で、GD74に従えば、 $a_{**}$を全部 1 にするのがデフォルト。一様分布ってことね。

 シミュレーション。いろいろ試してみると、BFはポワソン、同時多項、独立多項、超幾何の順に高くなる。サンプルサイズを動かすと同じように大きくなるけど、4つのBFの差は結構広いし、漸近的に近くなるわけではないので要注意。

 事例。[各抽出スキームについてひとつづつ。略]

 結論。[...中略...]
 本論文ではGD74が定式化したBFについて解説したけど、ほかの定式化もある。対数線形モデルの枠組みでやるとか。また、GD74とはちがう形式の事前分布を使う手もある。解析的には解けなくなって、MCMCを使わないといけなくなるかもしれないけどね。
 云々。

 。。。へー、こういう仕組みだったんすか。細かいところはわかんないけど、おおざっぱには理解できたので、良しとしよう。
 クロス表の独立性検定のとき、ふだんは抽出スキームについてほとんど考えないけれど(サンプルサイズが大きければ大差ないから)、BFの場合はきちんと考えないといけない、というのが最大の収穫であった。BayesFactorパッケージのcontingencyTableBF()だと、引数typeで上記の4つのスキームが選べる。

論文:データ解析(2015-) - 読了:Jamil, et al. (2016) クロス表のベイズ・ファクター

粕谷英一(2015) 生態学におけるAIC の誤用 ─ AIC は正しいモデルを選ぶためのものではないので正しいモデルを選ばない. 日本生態学会誌, 65, 179-185.
まさに題名そのままに、AICはあくまで平均的にみてよりよい予測を提供してくれるモデルを選ぶための指標であって真の構造を表現しているモデルを選ぶための手法じゃないよ、という論文。勉強になりましたです。

論文:データ解析(2015-) - 読了:粕谷 (2015) AIC では正しいモデルを選べない、なぜならAICは正しいモデルを選ぶためのものではないから

2016年8月22日 (月)

Weinberg, M.S., Williams, C.J. (2005) Fecal matters: Habitus, embodiments, and deviance. Social Problems, 52(3), 315-336.
 以前、雑誌のコラムのために身体化認知にまつわる論文を片っ端から集めて分類した際、うず高く積まれた「うっかり入手しちゃったけど関係なさそう」論文の山において、もっとも異彩を放っていた論文。このたび資料を整理してる最中にお手洗いに寄り、個室のドアを閉めたところでふと思い出した。別にいまわざわざ読むこたないんだけど、つい探して手に取り、ついつい読み通してしまった。

 アメリカの学生172人に、ウンコにまつわる経験についてインタビュー&質問紙。排便の音を他人に聴かれたらどんな気がしますかとか、水を流してもブツが流れなかったらどうしますかとか。異性愛志向/同性愛志向の男/女、計4グループに訊きました、というところがミソである。インタビューは逐語録をコーディングして集計。
 インタビューの内容が延々と紹介されているんだけど、途中で眠くなってしまって適当に読み飛ばした。
 結果のまとめ。排便関連事象に関する社会的反応にもっとも敏感なのは異性愛女性。ついで、同性愛男性、同性愛女性、異性愛男性の順。このように、排便のハビトゥスは社会文化的要因に媒介される。ジェンダーも性的アイデンティティも効いている。云々。

 という実証ベースの話が終わって、やおら3pにわたる理論的考察がはじまるところが、なんというか、社会学っぽい。
 近年の社会学では身体に関心が向けられている。そこでは社会構築主義の限界が強調され、身体化という概念を通じて物質的アプローチと構築主義的アプローチとの統合が図られている。
 排便という問題を身体化という概念によって理解することには以下の意義がある。

  1. 排便関連の逸脱が最初に知られる感覚はなにかについて検討することによって、行為が身体化される様子を知ることができる。本研究によれば、視覚(ウンコを他人に見られる)、嗅覚(臭いを嗅がれる)の順で心配度が高い。
  2. 感情を身体化した思考として捉える感情理論において、身体化は重要な役割を果たす。ゴフマンがいうように、感情は個人的感覚と公的モラリティを統合することによって社会的秩序を強化する。本研究は、排便関連の災難によって人が狼狽し、そこから多様なdistancing行動が引き起こされる例を示した。それは社会的問題回避という認知的な行為であるだけでなく、自分の感情への対処という行為でもある。[distancingってなんて訳せばいいのかわからないが、本研究での事例で言うと、いくら水を流しても流れないのでお手洗いから逃げ出してきました、という発言がそれにあたるのだろう]
  3. 本研究では身体境界の裂け目への警戒が異性愛女性において強いことが示された。異性愛女性の身体イメージは女性らしさという文化的概念によって媒介されている。ジェンダーはかくも身体化されており、ハビトゥスは不安、困惑、恥を通じてジェンダーの不公平を強化している...[後略]
  4. ハビトゥスの支配からの意図的無視を示す言説もあって... 異性愛男性は排便ハビトゥスを無視することで力を示し、逆に同性愛男性は身体境界への強い関心によって男らしさヘゲモニーへの抵抗を示す... [略]
  5. 本研究はスティグマ研究と関連していて... 云々云々云々...[もはや読んでません]

 というわけで、身体化という概念は逸脱の社会学へのさらなる貢献をもたらすだろう、とかなんとか...

 正直、かなり早い段階から読み飛ばしモードに入っていたんだけど(すいません)、ゴフマンいうところの「身体化」と、身体化認知の研究でいうところの「身体化」ではかなり意味合いに違いがあることがわかった。どうちがってどう通底しているのか、関心があるんだけど、この論文を精読したところでわからんだろう。Goffman(1967)というのを読むとよいらしい。邦訳があるらしい(「儀礼としての相互行為」)。

 話は違うけど... 往年の名ピッチャー、たしか金田正一さんだったと思うんだけど、ずいぶん前のTV番組でこんな話をしていた。マウンドでひそかにウンコを我慢しつつ打線を抑え、攻守交代とともにトイレに駆け込んだ。スッキリしたのは良いが、次の回でボロボロに打ち込まれてしまった。「糞力(くそぢから)」という言い回しがあるけど、あれは本当だ、と。
 わかる。すごくわかる。「なにくそ」と一生懸命仕事しているときも、途中でトイレに立ってうっかり大きいのを排出すると、席に戻ってきたときには瀬戸内の凪の海のように穏やかな、「許そう...すべてを...」という心持ちになっていて、しばらく元に戻れないじゃないですか。戻れないですよね。
 そういう実証研究がどっかにあるだろう、身体化認知とも関係しそうだ、と思うんだけど、先日の原稿準備の際には結局見つけられなかった。探し方が悪いのかなあ。

論文:その他 - 読了:Weinberg & Williams (2005) ウンコ問題:ハビトゥス、身体化、逸脱

Wagenmakers, E.J. (2007) A practical solution to the pervasive problems of p values. Psychonomic Bulletin & Review, 14(5), 779-804.
 伝統的な仮説検定(NHST)をディスりまくった上でベイジアン・アプローチを推す解説論文。
 JASA(統計学の雑誌)に掲載されたベイズ・ファクターの解説論文を読んで、難しさに困惑したので、方針を変えてPB&Rの解説論文に目を通した次第。実験心理学の雑誌ですわよ奥さん!必ずしも数学が得意とはいえないかもしれない方向けの啓蒙論文ですわよ!あーらステキ!これが臨床心理学の雑誌とかだと、数学が得意でないと言い切れる方向けになってもっとステキなのに!

 以下、内容のメモ。予想に反して面倒くさかった。

 イントロダクション
 心理学におけるNHST批判の主な論点は次の3つだ。

 こうしてみると、統計学におけるNHST批判とちがい、心理学者は解釈上の問題にばかり焦点を当てていることがわかる。本論文では無知モーマイな心理学者の諸君に[←そうは書いてないけどまあそれに近い]、統計学者からみたNHSTの真の問題点を指摘しよう。そして輝けるベイジアン・パラダイムについて教えてやるから聞け。
 注意:

 [いかん。面白いんで細かめにメモ取っちゃったけど、このペースではなかなか終わらない。以下、もう少し粗めにメモする]

 NHSTとはなにか
 [...略...] 本論文ではネイマン・ピアソン流のNHSTではなくフィッシャー流のNHSTに焦点を当てる。

 NHSTの問題点[豊富な事例がついている...]:

  1. p値は決して観察されることのないデータ(帰無仮説の下での架空のデータ)に依存している。[事例が3つ。たとえば、たとえデータが同じでも、実は(現実にはあきらかにひっかかってないんだけど)測定にセンサリングがあったのだとあとでわかったら、標本分布が変わってきちゃうことになるよね、それっておかしくない?というような話]
  2. p値は未知の主観的意図に依存しうる。[事例3つ。たとえば、途中までの結果を見てデザインを微妙に変えることって、実際にはよくあるし、それ自体は本来悪いことじゃないはずじゃん?でもそういうのNHSTだとうまく対応できないじゃん?というような話。なるほど、これは納得]
  3. p値は統計的証拠の定量化になっていない。[事例1つ。p値が全く同じでサンプルサイズが違う実験がふたつあったとき、Fisherの見方では証拠の強さは同じなのに、サンプルサイズが大きいほうが強いと思う人が多い、という話]

[疑問に思った点をメモしておく。ま、私ごときのこんな疑問は、この分野の膨大な議論の蓄積に照らせば屁のようなものだろうが。。。
 1.は、ほんとにNHSTの問題点なのかどうか、よくわからなかった。統計的推論はどうしたってデータと知識のアマルガムだ。頻度主義の立場に立ち、データをある確率分布のひとつの実現値として捉えようとするとき、その確率分布について考える際にデータには基づいていない知識が用いられること自体は、ベイズ流の立場に立った時の事前分布がデータに基づいていないとの同じで、別に奇妙な話ではないのではなかろうか。もっとも、頻度主義的な統計的推論においては知識の混入を明示する枠組みが欠けているのが問題だ、とか、尤度原理は死守すべきだ、といった主旨なら納得するけど。あ、そういう主旨なのかな、ひょっとして。
 3.は、Fisherの考え方を人々が正しく理解しているかという問題と、Fisherの考え方とベイジアンの考え方のどっちがよいかという問題が混じっているように思う。前者は単に多くの人が勘違いしているよねという話であって、後者の議論への決定打にはならないはずだ]

 ベイズ推論とは何か
 [いまベイズの論文って増えてますねん.. でも心理学では見かけませんなぁ... どういう仕組みかというとですね、二項パラメータの推定を例にとると... 云々を2p強で説明]
 [ベイジアンの仮説検定とは ... ベイズファクター(BF)とは... 計算例... Jeffreyの解釈基準...云々で1p]
 事前分布をどうするか。検定の文脈では、主観的ベイジアンにとっては事前分布はそんなに大問題ではないが(それは事前の信念だから)、客観的ベイジアンにとっては大問題だ。客観的事前分布は十分にあいまいでなければならないが、それはパラメータのありそうにない値に確率を与えることになるわけで、つまり仮説の複雑性を増大させることになり、仮説の事後確率が常に低くなるからだ。これを避けるために、local BF, intrinsic BF, partial BF, fractional BFなどが提案されている[←恥ずかしながら存じませんでした。Gillの本を読むと良いらしい]
 云々。

 p値が同じなら証拠の強さも同じだといえるか
 [もちろん、いえない、という話である。いや、それはさあ、証拠の強さというのをベイズ的に定義すれば、それはそうなるんでしょうけど...
 事例として、p値を固定した状態で標本サイズを増やすと帰無仮説の事後確率は高くなるという現象を示している。正直、ベイズ流の事後確率と頻度主義のp値を比較するほうがどうかしているよと思ったが、著者もその点は言い訳していて、いわく、どんな事前分布を使おうが帰無仮説の事後確率は標本サイズを増やしたときp値と単調に関連したりはしないのだということを示したかったのだ、とかなんとか。
 きちんと読んでないのにこんなことを書いてはいけないんだけど、これはなんというか、まず文中にp値に対する素朴な誤解を忍び込ませ、やおらそれを叩く、というタイプの藁人形論法ではなかろうか。正直、私にはよくわかんないや...]

 NHSTに代わる手法
 p値に代わる手法としてこれまでに提案されたものを挙げると:

いずれもモデル選択手法である。
 p値に代わる手法に求められる要件として以下が挙げられる。1-3は理論的要件、4-5は実験心理学者の実用的要件:

  1. 観察されたデータだけに依存する手続きであること
  2. 調査者の未知の意図に依存しないこと
  3. 帰無仮説と対立仮説の両方を考慮した指標であること
  4. 実装しやすいこと(SPSSのボタンをクリックしたら結果が得られるというような簡単さが必要)
  5. 客観的であること

上に挙げた手法は1-3を通過できない。ベイジアンの手法1は1-3を通過するけど4に反する(MCMCは実験心理学者には難しすぎる)。主観ベイジアンは5にも反する。そこで、客観ベイジアンの手法をどうにか簡単にすることを考えよう。

 BIC近似によるベイジアン仮説検定
 [というわけで、ベイズファクターを$\exp(\Delta BIC / 2)$で近似できるという説明で1p。事前分布はunit information priorがいいよとのこと。詳細は付録をみよとのことだが、えーっと、それってハイパーパラメータがデータで決まるってことですよね... 経験ベイズのススメっていう理解でよいのでしょうか...]
 [BIC近似の注意点。細かいはなしなのでメモ省略]
 [ANOVAで検定のかわりにBICで近似したベイズファクターを使うという例。ANOVA表から手計算する。面倒なので読み飛ばした]

 結論
 実験心理学者たちよ、p値じゃなくてBICで近似したベイジアンな検定をつかいたまい。

 やれやれ... 長かった... 面倒くさかった...

 それにしても、p値というのは巨大な怪物だなあ、とため息がでた。
 この論文のようにベイジアンに足場を置いてp値を批判することは可能だろう。あるいは、ネイマン=ピアソンが諸悪の根源なり、フィッシャーに戻れ、と主張することも可能だろう。二値的な統計的判断そのものを批判し、信頼区間を使いましょうとか図を使いましょうとか、そもそも我々はもっと不確実性を受容するべきなのだとか、そういったタイプの批判も可能だろうし、お望みならば、世の中大きくは変えられないけど、従来の検定の代わりにもっと手法Xを使おうよ、そうすれば世の中ちょっぴりましになるよ、と主張することも可能だろう(Xには好きな手法の名前を入れる。FDRとか)。
 ここに巨大な怪物が居座っている、現状はまずいよねとみんながうなずく。でもいざどうするかとなると百家争鳴、どこかの足場に立った批判と提案しかできない。困ったことに、足場によって怪物の姿はまるきり異なる...という感じだ。

論文:データ解析(2015-) - 読了:Wagenmakers (2007) p値はやめてBICの差を使いなさい

2016年8月19日 (金)

Kass, R.E., Raftery, A.E. (1995) Bayes Factors. Journal of the American Statistical Association, 90(430), 773-795.
 題名の通り、Bayes Factor(BF)についての総説的論文。前から気になっていたんだけど、このたびきっかけがあってざっと目を通した。難しかったー。めんどくさかったー。

 以下、内容のメモ。

 まず、BFが役立ちそうな事例を5つ紹介。帰無仮説を支持する事例が3つ、モデル不確実性を考慮する奴がひとつ、変数選択課題がひとつ。[めんどくさいのでパス]

 BFの定義。2つの仮説$H_1, H_2$について、BFとは$P(D|H_1)/P(D|H_2)$であり、事後オッズ = BF × 事前オッズである。それぞれの仮説が自由パラメータのない単一の分布であれば、BFとは尤度比のこと。未知パラメータを含んでいても、BFは形としては尤度比だけど、いわゆる尤度比ってのは最大尤度の比なのに対して、BFは周辺尤度の比である。つまり、ここでの$P(D|H_k)$はパラメータ空間を通じて積分して得られるものである。また、尤度比検定では仮説がネストしているけど、BFではそうとも限らないという点に注意。
 解釈の仕方。BFのlog10を{0.5,1,2}で4分割してみたり[よく本に載っているJeffreysの基準ね]、尤度比みたいに2logを{2,6,10}で4分割したりする[へー]。
 ところで、モデルが真であるかどうかを話から切り離し、BFを次のように解釈することもできる。いまデータ$D=\{y_1, \ldots, y_n\}$があり、それぞれの$i$に対して、$\{y_1, \ldots, y_{i-1}\}$に基づく$y_i$の予測分布$\hat{P}_i(\cdot)$を生成するなんらかのルールを構成できたとしよう。そのルールの性能評価を、対数スコアリング・ルール$\log \hat{P}_i(y_i)$によって行うとすると、全体のスコアは$LS=\sigma_i log \hat{P}(y_i)$。このルールってのが$H_k$から得られるのだとすると、$\log P(D|H_k) = \sum_i \log P(y_i | y_1, \ldots, y_{i-1}, H_k) = LS_k$だ。ってことは、BFの対数ってのはふたつの$LS_k$の差だ。つまりBFとはデータを2つの仮説に基づく予測の相対的成功度の差だとみることができるのだ。[←うううう... 話が急展開過ぎてついていけない... あとでゆっくり考えよう]

 BFの計算の仕方。本来は
 $I = P(D|H_k) = \int P(D|\theta_k, H_k) \pi (\theta_k|H_k) d \theta_k$
を求めたいわけだけど($\pi(\theta_k|H_k)$ってのはパラメータの事前分布ね)、こんなの真っ正直に求めてらんない。3つの方法がある。

手法の比較。解析的に求められるんならそれがベスト。ラプラス法とその変形もなかなか正確。複雑なモデルならモンテカルロ積分。MCMCは今後に期待。シュワルツ基準は簡単なのが取り柄、自由度がでかいときには正確でない。

 事前分布をどうするか
 既存知識から構成するやり方については、Kadane et al (1980 JASA)をみよ。云々、云々...[めんどくさいのでパス]
 感度分析 ... [パス。すいませんいまちょっとそんな心の余裕がないです]
 非正則事前分布 ... [パス]

 モデルの不確実性。[読んでないからわかんないけど、ベイジアンモデル平均みたいな話だろうか。とにかく一章まるごとパス]

 BFの実例。冒頭の5つの事例について、BFによるアプローチを紹介。[パス]

 議論の的となる話題を3つ。

  1. そもそもあるシャープな仮説が正しいかどうか検証しようという姿勢がバカバカしい、という批判について。そんなことはない、もともと、科学において仮説が正しいとは、そこからの逸脱が十分に小さいということだ。だからといって検定より推定のほうが自然だということにはならない。[←なるほど。仮説検定へのラディカルな批判として、仮説に対する二値的な判断がよろしくないという意見があるが、そういう立場には立たないってことね]
  2. BFと伝統的な仮説検定のどっちがよいか。膨大な議論があるが、主な論点は:
    • p値は帰無仮説が真である事後確率ではないけど、誤解が後を絶たないよ。
    • 頻度主義的な検定はサンプルサイズが大きいといつも有意になっちゃうよ。
    • BFは尤度原理に従っているから安心だよ。ケースが逐次的に生じる臨床試験のような場面で、事前に計画していない分析をするときとかさ。
    • BFはネストしてないモデルでも比較できるよ。
    • モデルが3つ以上あるとき、検定だと大変だけど、BFならモデル不確実性への対処という形で対応できるよ。云々。
  3. BFじゃなくて、ご存知 AIC=-2(対数最大尤度)+2(パラメータ数) を支持する議論。主に2つある。
    • Akaike(1973)に代表される予測の観点からの議論。いま、所与のデータと一連のモデルの下で、将来のデータについての予測分布を構成したいとしよう。もし予測分布が、単一のモデルと、そのパラメータ推定値に条件づけられたものでよいならば、AICで選択されるモデルは漸近的に最良なモデルである。なるほど。しかし、パラメータの値とモデルの形式には依然として不確実性があるわけで、それを考慮していないという意味で、得られる予測分布は正しくない。実際、AICはパラメータ数を漸近的にさえ過大推定するといわれている。
    • Akaike(1983)に代表されるベイズ的な議論。 AICによるモデル選択は、BFによるモデル選択と漸近的に等価である。なるほど。でもそれは事前分布の精度が尤度の精度と比較できるレベルである場合に限られる。実際には、事前情報はデータが与える情報と比べて乏しい場合が多い。そのときは、事後確率が最大なモデルとは、AICじゃなくてBICが最小なモデルである。
    云々。

 研究紹介。[パス]
 結論。[パス]

論文:データ解析(2015-) - 読了:Kass & Raftery (1995) ベイズ・ファクターとはなにか

2016年8月10日 (水)

Ozaltın, O.Y., Hunsaker, B., Schaefer, A.J. (2011) Predicting the Solution Time of Branch-and-Bound Algorithms for Mixed-Integer Programs. INFORMS Journal on Computing. 23(3), 392-403.

 B&Bアルゴリズムで整数計画問題を解いているさなかに、その問題があとどのくらいの時間で解けるかを予測する手法を提案する論文。
 たまたま見つけてディスプレイ上で眺めた。なにこれ、俺って検索の天才なの?! ついに救いの神を見つけちゃったわけ?! と5秒くらい興奮したけど、ま、神はそんなに甘くない。

 いわく。
 終了時間の予測にはMIP gapがつかわれることが多いが、たいていずっと一定で、解が見つかる前に突然下がるので、いまいち使いにくい。未処理ノード数を監視することもあるけど、減っているからといってもうすぐ終わるとは限らないし、増え続けることだってあるので困る[←そうそう!]。そこで新指標SSGを提案しましょう。

 先行研究概観。
 branch-and-boundアルゴリズムのノード数推定にはオフライン法(探索打ち切り後に用いる)とオンライン法がある。前者は...[略]。後者としては、未探索ブランチのノード数はこれまでに探索したブランチのノード数と似ているだろうと仮定する奴とか...[略]...がある。
 我々の提案はこれらとはちがって、まずは探索の進行を示す連続的指標をつくることを考える。

 提案手法。
 全体のMIP gapじゃなくて、B&Bツリーをサブツリーに分割し各サブツリーの最適性gapを測る。サブツリーへの分割がガンガン変わるというところがポイント。で、合計してうまいことスケーリングし、単調に増えていく指標にする。
 この指標の時系列をつかって終了時間を予測する。カルマン・フィルタとかだと大変なので、二重指数平滑化で予測する由。

 途中で「あ、これは... 誰かにソフトを作ってもらわないとだめだ...」と気づき、急速に関心がなくなってしまった。パラパラ捲っただけだけど読了にしておく。著者はBAKというソフトを配っていて、提案手法はそこで実装してある由。 整数計画ソルバーとして、論文の時点ではSYMPHONY、GLPK、CBC、に対応していたらしい。 いまでも配っているみたいだが、開発は止まっちゃっている模様。

論文:データ解析(2015-) - 読了:Ozaltın, Hunsaker, Shaefer (2011) 整数計画問題があとどのくらいで解けるかを予測する新手法

2016年8月 9日 (火)

Atkinson, A., Bailey, R.A. (2001) One hundred years of the design of experiemnts on and off the pages of Biometrika. Biometrika, 88(1), 53-97.
 実験計画の歴史をBiometrika誌掲載論文を中心に振り返る、という長文の論文。この号はこの雑誌の100年記念号で、こういうのが各分野について載ったらしい。
 前提知識が足りなくてほとんど理解できない内容なのだけれど、途中でうつらうつらしつつ、へえーそんな問題があるのねー...などと無責任に読了。
 いくつかメモ:

論文:データ解析(2015-) - 読了:Atkinson & Bailey (2001) Biometrikaで振り返る実験計画の100年

2016年8月 4日 (木)

Bookcover 元老―近代日本の真の指導者たち (中公新書) [a]
伊藤 之雄 / 中央公論新社 / 2016-06-21
近代史の本を読んでて、首相交代の際になぜ西園寺公望がこんなに強い発言権を持つのかと不思議だったのだが、元老というのは非公式とはいえある種の制度だったのか、知らなかった。
 国際連盟脱退の際、西園寺は内心では反対であったが黙認した。天皇機関説が排撃されたとき、西園寺は反対ではあったが逆らわなかった。元老の権力と宮中人事を守るためであった由。時節を待つといえば聞こえはいいけれど、要するに、システムの中の人にとってシステムの維持は目的と化す、国民はどうでもいい、ってことじゃないですかね...

日本近現代史 - 読了:「元老 近代日本の真の指導者たち」

Bookcover 地上最後の刑事 (ハヤカワ・ポケット・ミステリ) [a]
ベン H ウィンタース,Ben H. Winters / 早川書房 / 2013-12-06
Bookcover カウントダウン・シティ (ハヤカワ・ポケット・ミステリ) [a]
ベン・H. ウィンタース / 早川書房 / 2014-11-07
Bookcover 世界の終わりの七日間 (ハヤカワ・ポケット・ミステリ) [a]
ベン H ウィンタース,Ben H. Winters / 早川書房 / 2015-12-08
近々地球は小惑星と衝突し人類は壊滅するであろうと予測されているなか、あまりに愚直な(元)刑事の主人公が徐々に崩壊していく社会を彷徨うディテクティブ・ストーリー三部作。とても面白かったが、読みかけの数週間の間、ちょっとどんより暗い気分になってしまった...

Bookcover 戦艦武蔵 (新潮文庫) [a]
昭, 吉村 / 新潮社 / 2009-11

Bookcover 紙の動物園 (新☆ハヤカワ・SF・シリーズ) [a]
ケン リュウ / 早川書房 / 2015-04-25
中国系アメリカ人作家の短編集。SF好きな人にはケッと思われるかもしれないけど、表題作「紙の動物園」が断然良いと思った。涙絞られる。

Bookcover これでよろしくて? [a]
川上 弘美 / 中央公論新社 / 2009-09
著者にしては軽い読み物。女の人って大変だなあ。

Bookcover シェイクスピア全集 (1) ハムレット (ちくま文庫) [a]
W. シェイクスピア / 筑摩書房 / 1996-01-26
数年前に小田島訳で読んだんだけど、不意に読みなおしたくなって、松岡訳で読んでみた。
 今回気が付いたのは、脇役中の脇役であるローゼンクランツとギルデンスターンが、あまりに脇役過ぎて可哀想、という点。なんでも、逆にこの二人を主役に据えた「ローゼンクランツとギルデンスターンは死んだ」という20世紀の有名な戯曲があるのだそうだ。図書館で探してみよう。
 それにしても、これは持論なんですけど、「ハムレット」から我々が得られる教訓はですね、ポローニアスのような人は大事にしなきゃいけないということだと思う。人間としてはかなり浅い人だけど、こういう表層的な世知の持ち主たちが、世の中の安定には必要だと思うんですよね。こういうどうでもよい人たちが、様々な危機を解決するでなくうやむやにし、そのようにして世界は散文的に続いていくのである。

フィクション - 読了:「地上最後の刑事」「カウント・ダウン・シティ」「世界の終わりの七日間」「神の動物園」「ハムレット」「戦艦武蔵」「これでよろしくて?」

Bookcover 烈侠 ~山口組 史上最大の抗争と激動の半生 [a]
加茂田 重政 / サイゾー / 2016-07-21
山一戦争で知られる一和会の大物ヤクザが語る回想記。書誌情報にははいってないけど、企画は久田将義さん、聞き手は花田歳彦さんというライターの方。大事なところには関係者の証言も挿入していて、意外にきちんとした作りの本であった。

Bookcover この国を揺るがす男:安倍晋三とは何者か (単行本) [a]
朝日新聞取材班 / 筑摩書房 / 2016-06-08

Bookcover プライベートバンカー カネ守りと新富裕層 [a]
清武 英利 / 講談社 / 2016-07-13

Bookcover となりのイスラム 世界の3人に1人がイスラム教徒になる時代 [a]
内藤正典 / ミシマ社 / 2016-07-17

Bookcover さらばカリスマ セブン&アイ「鈴木」王国の終焉 [a]
/ 日本経済新聞出版社 / 2016-06-04

Bookcover 失敗の研究 巨大組織が崩れるとき [a]
金田 信一郎 / 日本経済新聞出版社 / 2016-06-25
著者は日経BP出身で、現在は日経の編集委員という人。個別にはいろいろ意見があるかもしれないけど、やっぱり単著の本というのは面白いですね。

ノンフィクション(2011-) - 読了:「烈侠」「この国を揺るがす男」「失敗の研究」「プライベート・バンカー」「となりのイスラム」「さらばカリスマ」

Bookcover 満足の文化 (ちくま学芸文庫) [a]
J.K. ガルブレイス / 筑摩書房 / 2014-05-08
最近ではNo.1の面白本であった。メモを取り出したら最後、どこもかしこも全部メモしないと収まらないというような。ガルブレイスさんの本は、古本屋で探してでも読まなければならない...

Bookcover 右手の優越―宗教的両極性の研究 (ちくま学芸文庫) [a]
ロベール エルツ / 筑摩書房 / 2001-06

Bookcover 室町幕府と地方の社会〈シリーズ日本中世史 3〉 (岩波新書) [a]
榎原 雅治 / 岩波書店 / 2016-05-21

Bookcover シェイクスピア - 人生劇場の達人 (中公新書) [a]
河合 祥一郎 / 中央公論新社 / 2016-06-21

Bookcover 日本会議の正体 (平凡社新書) [a]
青木理 / 平凡社 / 2016-07-09

ノンフィクション(2011-) - 読了:「右手の優越」「満足の文化」「室町幕府と地方の社会」「シェイクスピア」「日本会議の正体」

Bookcover ネオ寄生獣 (アフタヌーンKC) [a]
遠藤 浩輝,竹谷 隆之,萩尾 望都,PEACH‐PIT,平本 アキラ,真島 ヒロ,皆川 亮二,植芝 理一,太田 モアレ,韮沢 靖,熊倉 隆敏,瀧波 ユカリ / 講談社 / 2016-07-22
講談社と縁の深い作家を中心とした12人が、もはや日本マンガの古典となりつつある岩明均「寄生獣」を題材に描いた短編集。なかなか面白い作品が多いけれど、これはなんといっても、萩尾望都の圧倒的な力にただ平伏するしかない...

Bookcover イノサン Rougeルージュ 3 (ヤングジャンプコミックスDIGITAL) [a]
坂本眞一 / 集英社 / 2016-07-19

Bookcover 甘々と稲妻(7) (アフタヌーンKC) [a]
雨隠 ギド / 講談社 / 2016-07-07

Bookcover ランド(3) (モーニングコミックス) [a]
山下和美 / 講談社 / 2016-07-22

Bookcover MUJIN -無尽- 3巻 (ヤングキングコミックス) [a]
岡田屋 鉄蔵 / 少年画報社 / 2016-06-30

Bookcover 木根さんの1人でキネマ 2 (ヤングアニマルコミックス) [a]
アサイ / 白泉社 / 2016-06-29
隠れ映画マニアの30代独身女性を主人公にしたコメディ。基本的にわけ隔てのない映画愛に溢れているのだけれど、「映画 ビリギャル」に対してだけはなぜか冷たい、というところが可笑しい。

コミックス(2015-) - 読了:「木根さんの1人でキネマ」「無尽」「甘々と稲妻」「ネオ寄生獣」「ランド」「イノサン」

Bookcover オールラウンダー廻(19)<完> (イブニングKC) [a]
遠藤 浩輝 / 講談社 / 2016-05-23
19巻目にしてついに最終巻。格闘技には全く関心がないんだけど、そんな私にも面白いマンガであった。お疲れさまでした。

Bookcover ワカコ酒 7 (ゼノンコミックス) [a]
新久千映 / 徳間書店 / 2016-07-20

Bookcover 恋は雨上がりのように(5) (ビッグコミックス) [a]
眉月じゅん / 小学館 / 2016-06-10

Bookcover 江戸のたまもの (ビッグコミックス) [a]
昌原 光一 / 小学館 / 2016-06-30

Bookcover 地獄のガールフレンド(1)【期間限定 無料お試し版】 (FEEL COMICS swing) [a]
鳥飼茜 / 祥伝社 / 2020-04-06

Bookcover 団地ともお (24) (ビッグコミックス) [a]
小田 扉 / 小学館 / 2014-09-30

Bookcover イムリ 19 (ビームコミックス) [a]
三宅 乱丈 / KADOKAWA/エンターブレイン / 2016-05-25

コミックス(2015-) - 読了:「イムリ」「団地ともお」「オールラウンダー廻」「地獄のガール」「江戸のたまもの」「恋は雨上がりのように」「ワカコ酒」

Bookcover ふつつかなヨメですが! (2) (ビッグコミックス) [a]
ねむ ようこ / 小学館 / 2016-05-12

Bookcover かくしごと(1) (KCデラックス) [a]
久米田 康治 / 講談社 / 2016-06-17

Bookcover 自撰 人情幕ノ内 (ビッグコミックス) [a]
昌原 光一 / 小学館 / 2016-06-30

Bookcover イノサン Rouge ルージュ 2 (ヤングジャンプコミックス) [a]
坂本 眞一 / 集英社 / 2016-05-19

Bookcover あさひなぐ (19) (ビッグコミックス) [a]
こざき 亜衣 / 小学館 / 2016-05-30

Bookcover 僕らはみんな河合荘 8巻 (ヤングキングコミックス) [a]
宮原 るり / 少年画報社 / 2016-05-30

Bookcover オリオリスープ(2) (モーニング KC) [a]
綿貫 芳子 / 講談社 / 2016-05-23

コミックス(2015-) - 読了:「ふつつかなヨメですが」「かくしごと」「自撰・人情幕の内」「イノサン」「あさひなぐ」「僕らはみんな河合荘」「オリオリスープ」

Bookcover 孤食ロボット 3 (ヤングジャンプコミックス) [a]
岩岡 ヒサエ / 集英社 / 2016-05-25

Bookcover ダンス・マカブル 2‐西洋暗黒小史‐ (MFコミックス フラッパーシリーズ) [a]
大西巷一 / KADOKAWA/メディアファクトリー / 2011-08-19

Bookcover プリニウス 4 (バンチコミックス45プレミアム) [a]
ヤマザキマリ,とり・みき / 新潮社 / 2016-06-09

Bookcover 珈琲色に夜は更けて シリーズ 小さな喫茶店 (ビームコミックス) [a]
山川 直人 / KADOKAWA/エンターブレイン / 2016-06-25

Bookcover 捜索者 (ビッグコミックス) [a]
谷口 ジロー / 小学館 / 2016-06-30
99年の作品。もちろん絵は素晴らしいんだけど、ストーリーは、ちょっと、ねえ...

Bookcover コトノバドライブ(3) (アフタヌーンKC) [a]
芦奈野 ひとし / 講談社 / 2016-06-23

Bookcover 淋しいのはアンタだけじゃない (1) (ビッグコミックス) [a]
吉本 浩二 / 小学館 / 2016-05-30
タイトルからはわかりにくいが、聴覚障害を主題にした真摯なノンフィクション。

コミックス(2015-) - 読了:「孤食ロボット」「ダンス・マカブル」「プリニウス」「琥珀色に夜は更けて」「捜索者」「コトノバドライブ」「寂しいのはアンタだけじゃない」

Bookcover 文鳥様と私15 (LGAコミックス) [a]
今 市子 / 青泉社 / 2015-03-20

Bookcover 百鬼夜行抄 25 (Nemuki+コミックス) [a]
今 市子 / 朝日新聞出版 / 2016-07-07

Bookcover 深夜食堂 (16) (ビッグコミックススペシャル) [a]
安倍 夜郎 / 小学館 / 2016-05-30

Bookcover おいピータン!!(16) (ワイドKC) [a]
伊藤 理佐 / 講談社 / 2016-06-13

Bookcover 四谷区花園町 [a]
高浜 寛 / 竹書房 / 2013-11-28
この人のマンガ、これまであまり良いと思ったことがなかったんだけど(なんというか、私には先鋭的すぎるというか)、これはいいなあ。昭和初期の新宿を舞台に、インテリ青年と貧しい生まれの娘の悲恋を描く。はじめての連載作品だそうだ。

コミックス(2015-) - 読了:「文鳥様と私」「百鬼夜行抄」「深夜食堂」「おいピータン!」「四谷区花園町」

本来それどころじゃないんだけど、読んだ本が溜まってしまって整理がつかないので... 最近読んだ本、まずはコミックスから。

Bookcover 茶箱広重 (小学館文庫) [a]
圭, 一ノ関 / 小学館 / 2000-06-16
圧倒的な画力と超のつく寡作で知られる作家の、75年から85年の短編集。この方、普段なにしておられるんだろうと不思議なのだが、こないだたまたま永田町の伝統芸能情報館という施設に寄ったら(最高裁の横にある奴)、この方が絵をかいた巨大なパネルがあった。

Bookcover はじめてのひと 1 (マーガレットコミックス) [a]
谷川 史子 / 集英社 / 2016-05-25

Bookcover 黒白(上) (KCデラックス イブニング) [a]
とりの なん子 / 講談社 / 2016-05-23

Bookcover 闇金ウシジマくん (37) (ビッグコミックス) [a]
真鍋 昌平 / 小学館 / 2016-06-30

Bookcover アルテ 5 (ゼノンコミックス) [a]
大久保圭 / 徳間書店 / 2016-06-20

Bookcover 東京BONごはん~おウチで作る名店の味~ (ニチブンコミックス) [a]
入江 喜和 / 日本文芸社 / 2016-04-18
私が尊敬してやまない作家・入江喜和さんが珍しく描いた、軽いグルメ・ルポマンガ。2013年から2015年にかけて連載していたそうだ。お店の選択もなんだかいいかげんで、気楽な雰囲気である。

コミックス(2015-) - 読了:「東京BONごはん」「茶箱広重」「アルテ」「闇金ウシジマくん」「黒白」「はじめてのひと」

2016年8月 3日 (水)

Scott, N.W., McPherson, G.C., Ramsay, C.R., Campbell, M.K. (2002) The method of minimization for allocation to clinical trials: a review. Controlled Clinical Trials, 23, 662-674.
 都合により読んだ論文。Contolled Clinical Trialsなんていうジャーナルがあるのね、びっくり(現在はContemporary Clinical Trialsという誌名らしい)。そういえば院生のころ、学術雑誌の数は指数関数的に増えていて、このぶんだと20xx年には全人類の人口を上回るはずだと教わったことがあった。

 無作為化比較試験におけるminimizationについてのレビュー。ここでいうminimizationとは、分析じゃなくて計画の段階で、無作為化の原理に従いつつも群間で共変量の分布を揃えておくための、ある種の割付手続きを指している。へー、こういうのをminimizationっていうの?とびっくりした。「最小化」でいいのかしらん? それともなにか定訳があるのだろうか。

 いわく。
 無作為化比較試験(RCT)は介入を評価するためのゴールド・スタンダードだ。そこでは予後因子(prognostic factor)が群間で類似することが期待されるが、運悪くバランスが崩れることもある。それを防ぐために層別無作為化(stratified randomization)がよく使われているが、予後因子の数が多いときには層が多くなってしまい、現実的でない。

 そこで使われるのが最小化(minimization)である。これはもともとTaves(1974 Clin.Pharmacol.Ther.)とPocock & Simon (1975 Biometrics)が独立に唱えたもので、後者はsequential treatment assignmentと呼んでいた。
  処置群と統制群にわける場合について考えよう。 まず予後因子のセットを決める。たとえば{性別(2水準), 年代(3水準), リスク因子(2水準)}だとしよう。
 対象者をひとりづつ、どちらかの群に割り付けていく[書いていないけど、1人目はランダムに割り付けるんだと思う]。いま16人の割付が終わったとしよう。17人目は男性、30代、リスク因子高でした。16人について暫定的な集計表を作り、処置群と統制群それぞれについて、男性の人数、30代の人数、リスク因子高の人数を足しあげる(当然ながらダブりがある)。その値が小さい群のほうに17人目を割り付ける。これがTavesのいうminimizationである。ほかにも...

 なお、こういうふうにリクルート時点でわかっている対象者特性を割付に使うことを"dynamic allocation"とか"covariate adaptive"法という。"response adaptive"法(対象者の反応を使う方法)とは区別すること。

 他の手法との比較。

 批判。
 まず、Peto et al.(1976, Br.J.Cancer)はこう批判している。最小化しても完全な無作為化と比べてたいして効率が良くなってないし、リクルートメントに害を及ぼすし、あとで共変量を調整するのが難しくなるよ。これには反論が多い由(Simon, 1979 Biometrics; Brown, 1980 CancerTreatmentRep.; Halpern & Brown, 1986 Stat.Med.)。
 検討すべき論点が3つある。

 最小化はどのくらい使われているか。
 2001年以降にLancetとNEJMに載ったRCTの報告150本中、割付に最小化を使っているのは6本、層内でパーミュテーションブロックをつかっているのが43本、やりかたは不明だが層別無作為化をしているのが19本、Efronのbiased coin法が1本、Signorini et al.の動的バランシングが1本、urn無作為化が1本[←この辺、あとで調べよう...]。残る79本は割付方法を明示してなかった。

 考察。みんなもっと最小化をつかうといいよ。云々。

  。。。いやー、大変勉強になりました。「無作為化実験で共変量が多すぎて層別割付できないときどうするか」という問題にはずっと前から直面していたのだけれど、こういう研究群があったのね! これまで探し方が悪かったんだなあ。

 疑問点が2つ。

2016/08/12追記: 最小化(というか非ランダム化割付)に対する3つの批判のうちひとつめについて、引用されている文献のリストを作っておく:

論文:データ解析(2015-) - 読了:Scott, McPherson, Ramsay, Campbell (2002) ランダム化比較試験でたくさんの共変量を条件間でバランスさせる割付方法

Zubizarreta, J.R. (2012) Using Mixed Integer Programming for Matching in an Observational Study of Kidney Failure After Surgery. Journal of the American Statistical Association, 107(500), 1360-1371.
 ケース・コントロール・スタディで共変量が多いとき、対象者のマッチングを混合整数計画(MIP)でやりましょうという論文。ネットに落ちてたdraftで読んだ。

 まず、観察研究におけるマッチングとはなにか、その利点について説明があって...

 マッチングによくつかわれているのはネットワーク・アルゴリズムである。これは処理単位とそれにマッチングするコントロールのあいだの距離の合計を反復で最小化させる方法だが、どれだけ反復すればいいのかわからないし、コルモゴロフ・スミルノフ検定料とか共変量間の相関といった統計量を明示的にバランシングすることができない。
 そこで新手法をご提案しますよ。Rのパッケージmipmatchもつくりましたよ。

 この手法ではMIPを使います。なぜこれまで使われてこなかったか。それはtractableでなかったから(所与のサイズのもっとも難しい問題を解くのに必要なステップ数がサイズの多項式になっていなかったから)。これに対してネットワーク・アルゴリズムなら、シンプレクス法とかオークション・アルゴリズムとかで解けた。Rのoptmatchを参照のこと。
 しかし[...と線形計画についての紹介があって...]、最近MIPはとても発展し、マッチングに使えるようになったのであります。

 処理単位の集合を$T=\{t_1, \ldots, t_T\}$、潜在的なコントロール単位の集合を$C=\{c_1, \ldots, c_C\}$としよう($T \leq C$)。共変量のラベルの集合を$P = \{p_1, \ldots, p_P\}$とする。任意の処理単位とコントロール単位について、それぞれが共変量のベクトル$x_t, x_c$を持ち、距離$0 \leq \delta_{t,c} < \infty$を定義できるとしよう。
 さあ、整数計画として定式化しまっせ。深呼吸...

 変数$a_{t,c}$を、処理単位$t$がコントロール単位$c$に割り当てられたときに1、どうでないときに0とする。ベクトル(というか行列)にまとめて$a$とする。
 以下の式を最小化する$a$を
 $\sum_{t \in T} \sum_{c \in C} \delta_{t,c} a_{t,c} + \sigma_{i \in I} w_i \mu_i (a)$
 第一項はマッチドペアの共変量の総和。第二項では、共変量のインバランスを表すいくつかの指標$mu_i (a)$があり、それに重み$w_i$をつけて足しあげている。指標をどうするかはあとで述べる。

 制約条件は次の4本。
 1本目、$\sum_{c \in C} a_{t, c} = m, t \in T$。それぞれの処理単位は $m$ 個のコントロール単位とマッチする。
 2本目、$\sum_{t \in T} a_{t, c} \leq 1, c \in C$。それぞれのコントロール単位は、0個ないし1個の処理単位とマッチする。
 3本目、$a_{t,c} \in \{0,1\}, t \in T, c \in C$。そりゃそうですわね。
 4本目、$v_j(a) \leq e_j, j \in J$。ここで$v_j(a)$とは、制約式の$\mu_i(a)$と同様に、共変量のインバランスを表すなんらかの指標。[←なるほどね。制約をかける指標と最適化する指標が違っていていいように別の記号を使ってるわけだ]

 では、$\mu_i(\cdot)$をどう定義するか。具体的事例に即して考えます。[以下、論文の表記よりも簡略化してメモする]

 その1、単変量のモーメントをバランスさせたいとき。
 $\mu_i(a) = | \sum_t \sum_c \frac{x_{c,i} a_{t,c}}{mT} - \bar{x}_{T,i}|$
ここで$i$は共変量のインデクス。$\bar{x}_{T,i}$とはすなわち、処理群における共変量$i$の平均。$\sum_c \frac{x_{c,i} a_{t,c}}{m}$で、処理単位$t$にマッチした$m$個のコントロール単位における共変量$i$の平均になるから、つまり処理群における平均からの各コントロール単位の偏差の絶対値の和を最小化しているわけだ。[←あー、なるほどね。ここでは処理単位のセットが事前に決まっているわけね]
 絶対値記号が入ってて線形になっていないじゃんとお思いのみなさん。こうするといいのだよ。[←線形計画定式化の必須テクである。文系の私には、これが腑に落ちるまで結構な時間がかかった...]
 最適化式は
 $\sum_{t \in T} \sum_{c \in C} \delta_{t,c} a_{t,c} + \sigma_{i \in I} w_i z_i$
ってことにしといて、制約式に次の2本を追加する。
 $z_i \geq \mu_i(a)$
 $z_i \geq -\mu_i(a)$

 実データを使って実験してみる。$w_i$を大きくすれば満足いく結果が得られる。一般的アドバイスとしては、距離行列を平均で割っておき、共変量も標準化した状態で、処理単位数の1/10の値にするとよい。
 このように最適化式でバランスさせるのと制約式でバランスさせるのとどちらがよいか。制約式はわかりやすいし、MIPじゃなくて純粋な整数計画になるという利点がある。いっぽう閾値を小さくし過ぎるとinfeasibleになるというのが欠点。

 その2、共変量の多変量のモーメント(相関)をバランスさせる場合には...[略]
 その3、コルモゴロフ-スミルノフ検定料をバランスさせる場合には...[略]

 その4、共変量を正確にマッチングさせたい場合。
 $x_{.,p}$を名義共変量とし、とる値を$b \in B$とする。正確なマッチングは以下の制約式で表現できる。すべての$b$について
 $\sum_t \sum_c a_{t,c} I(x_{t,p}=b AND x_{c,p}=b) = m \sum_t I(x_{t,p} = b)$
これはぴったり同じ場合だが、差の絶対値の上限を決めて緩く制約しても良い。なお、当該共変量で分割して各部分でマッチングさせればそりゃぴったり合うけれど、そのやりかただと緩く制約することができない。
 とこで、上記のようなマッチングをfine balanceという。いっぽう
 $\sum_t \sum_c a_{t,c} I(x_{c,p}=b) = m \sum_t I(x_{t,p} = b)$
というのをnear-fine balanceという。
 ネットワーク・アルゴリズムでは複数の名義共変量の周辺分布をfine balanceないしnear-fine balanceさせることはできないが[←その理由が説明してあるが理解できなかった。Rosenbaum(2010)を読めとのこと]、提案手法だとできる。

 というわけで、以上を実現するRパッケージ mipmatch を作りました。これは中でIBMのCPLEXを呼びます。[...説明略]
 実データへの適用例 ... [略]
 $m$が処理単位のあいだで変動してよい場合には ... [略]

 考察。
 いまやMIPはすごい。使いましょう。
 マッチングは傾向スコアでやるという手もある。しかしそれは確率的なバランスが達成できるだけだし、ケース・コントロール研究においては傾向スコアが存在しない[←え、なんで? なくはないんじゃないの?]
 云々、云々。

 。。。いやー、この論文も勉強になりましたです。
 しっかし、この定式化だと、$a$は(処理単位数 x 潜在コントロール数)の二値行列になり、各行の和が$m$となるという制約と各列の和が0か1になるという制約しかかからないわけだ。サンプルサイズが大きいと、いかにCPLEXとはいえ、手に負えなくなるだろうな...

 この話は観察研究におけるマッチングの話だけど、ランダム化比較試験でもいくつかの共変量によって層別することはあるわけで(stratified randomization)、共変量がすごく多ければこの論文と同じ問題を抱えることになる。そういうときにMIPを使っている事例を探しているのだけれど、見当たらない。たぶん医学統計じゃなくて工業試験みたいな分野を探せばいいんだろうけど、検索のキーワードがわかんないんだよなあ。

論文:データ解析(2015-) - 読了:Zubizarreta(2012) ケース・コントロール研究でのマッチングを混合整数計画でやりましょう

2016年8月 2日 (火)

Navarro, D.J., Griffiths, T.L., Steyvers, M., Lee, M.D. (2005) Modeling individual differences using Dirichlet processes. Journal of Mathematical Psychology, 50(2), 101-122.
 調べ物をしていて偶然みつけ、なんとなくディスプレイ上で眺めていたら、これがちょっぴり面白くて、ついつい全部読んでしまった。
 ひとことでいっちゃうと、有限混合分布モデルならぬ無限混合分布モデルを提案する論文。

 まず、認知モデル構築において個人差を正面からモデル化することがいかに大事かという話があって...

 従来の主なアプローチはふたつある。(1)確率的(stochastic)パラメータ・モデル。個々の対象者が持っているパラメータ$\theta$を、あるパラメトリックな分布からの標本とみなす。(2)グループ・モデル。質的に異なる少数のグループがあると考える。

 階層ベイズモデルの観点からみてみよう。対象者数を$n$、対象者$i$の観察事例数を$m_i$とする。$i$の$j$番目の値$x_{ij}$として、
 $x_{ij} | \theta_i \sim F(\cdot | \theta_i) $
 $\theta_i | \phi \sim G(\cdot | \phi)$
データセットを$x$として、尤度関数は
 $p(x|\phi) = \prod_i \int \left( \prod_j F(x_{ij}|\theta_i) \right) G(\theta_i | \phi) d \theta_i$
モデルの適用に際しては$\phi$の事前分布が必要。$\phi \sim \pi(\cdot)$としておく。
 主に関心が持たれるのは次の2つだ。(1)認知モデルのパラメータの事後分布$p(\theta|x)$。(2)個人差モデルのパラメータの事後分布$p(\phi|x)$。

 確率的パラメータモデルはふつう、$G(\cdot|\phi)$について正規分布とかを想定する。いっぽうグループ・モデルは
 $G(\cdot | w, \theta) = \sum_z^k w_z \delta(\cdot | \theta_z)$
 $\sum_z w_z = 1$
という風に考える。つまり$\phi = (w, \theta)$となっている点に注意。ここで$\theta$ってのは$\theta_z$のベクトル、$\theta_z$ってのは個人じゃなくてあるグループのパラメータね。

 どっちのアプローチにも良し悪しがある。
 確率的パラメータモデルは個人差をユニモーダルな分布として捉えようとしている。つまり個人差を単一の典型的パラメータ値からの変動として捉えようとしているわけで、これは多くの場合不自然であろう(課題における個人差が課題の解釈のちがいから生まれているのなら、個人差はマルチモーダルであろう)。
 いっぽうグループ・モデルは、グループの数を決めるという難題を抱える。

 提案モデル。
 グループ・モデルのグループが無限にあると考える。すなわち
 $G(\cdot | w, \theta) = \sum_z^\infty w_z \delta(\cdot | \theta_z)$
と考えるわけ。実際のデータは有限だから、無限個のグループのなかから有限個のグループを抽出していることになるわけだ。これって心理学的にplausibleでしょ、云々。

 $\phi = (w, \theta)$の事前分布$\pi(\cdot)$については次のように考える。[ここからちょっとややこしくなる。さあ深呼吸]
 いったん話をグループ・モデルに戻す。ここで標準的な事前分布は以下であろう。
 $\theta_z \sim G_0(\cdot)$
 $w | \alpha, k \sim Dirichlet(\cdot, \zeta)$
 一本目、$G_0(\cdot)$をベース分布という。それをどう選ぶかというのは、通常のベイジアン・モデリングと同じく諸説あり、この論文の主題ではない。
 ポイントは二本目の式である。和が1になる有限個の確率変数の分布としては、ふつう$k$次元ディリクレ分布をつかうものだ。[...ここでディリクレ分布の密度関数について説明。省略。それにしても、この式に$\alpha$が出てくるのは話の先取りだろう。$\zeta$の誤植じゃないかな]
 $w_i$の並び順には意味がないので、パラメータはすべて同じ値とする。これを対称事前分布という。この値の大きさは、事前分布がどのくらい重視されるかを表す。ここではすべてのパラメータは$\alpha/k$であると仮定する。なぜなら...[ここ、勉強になったので全訳]

 ディリクレ・パラメータのこの特性を理解するためには、理想化された曲がったコイン(bent coin)を使った例について考えるのが有用であろう。
 ここにある曲がったコインがあり、データはの$n$回の独立なコイン投げによって得られるとする。これらはiidなベルヌーイ試行系列で、表が出る確率は$p$だ、という単純なモデルを考える。
 この未知の$p$の事前分布について考えよう。それは可能な結果を$k=2$通りしか持たないディリクレ分布、すなわちベータ分布だと考えることができる。コインがどう曲がっているのかわからないわけだから、$p$は対称でないとおかしい。そこでディリクレ・パラメータは$\alpha/2$としよう。
 データ中に表が$h$、裏が$t=n-h$回観察されたとする。事後分布は依然としてベータ分布だ(なぜならベータ族は二項分布の尤度関数に対して共役だから)。事後ベータ分布のパラメータは$h+\alpha/2, t+\alpha/2$となる。$p$の事後期待値は$\bar{p}=(h+\alpha/2)/(n+\alpha)$となる。分母をみるとわかるように、事後期待値への影響という観点から見て$n$と$\alpha$はcommensurateである。この性質は$k$が大きくなっても変わらない。
 さて、ここでの私たちの目標は、ある限られた量の情報だけを持つ無限次元の結果空間$W$について事前分布を指定することだ。情報の量が次元数$k$とは独立に決まるような事前分布を選ぶとよいだろう。そこでパラメータ数として$\alpha/k$を用いる。$k$がどうなっても合計が$\alpha$であるという点で都合が良い。


 さて、いよいよ$k \rightarrow \infty$としたときの事前分布について考える。
 $i$番目の観察が属するグループを$g_i$とする。$w_z$とは、$i$番目の観察がグループ$z$に属する確率であった。だから、
 $p(g_i = z | w) = w_z$
である。事前分布はこうなる。
 $x_{ij} | \theta, g_i \sim F(\cdot | \theta_z) $
 $g_i | w \sim Multinomial(\cdot | w)$
 $w | a, k \sim Dirichlet(\cdot | \alpha/k)$
 $\theta_z | G_0 \sim G_0(\cdot)$
 ここから無限長の$w$を消しにかかります。
 すでに$g_{-i} = (g_1, \ldots, g_{i-1})$が観察されているとしよう。$i$がグループ$z$に落ちる条件付き確率は、[...途中省略して...] 結局こうなる。
 $p(g_i = z | g_{-i}, \alpha, k) = \frac{s_z + \alpha/k}{i-1+\alpha}$
ここで$s_z$は、それまでの$i-1$個のうち$z$に落ちた数。$k \rightarrow \infty$とすると、$s_z$が0より大ならば
 $p(g_i = z | g_{-i}, \alpha, k) = \frac{s_z}{i-1+\alpha}$
となり、[...途中省略して...] また、$s_z$が0だったら$\frac{\alpha}{i-1+\alpha}$となる。
 この話をよくみると、実は中華料理店過程になっていて...[略]
 $\theta_i$の抽出は、よくみるとポリアの壺からの抽出になっていて...[略]

 [えーっと、途中から流し読みになっているけど、要するに、グループ数が無限のグループ・モデルでも、無限長のベクトルをうまいこと積分消去して推定できるよという話なのではないかと思う。さらに、ディリクレ過程混合モデルによって$\alpha$を推定しますとかって書いてある... もうやだ、パス、パス]

 分析例。10人の被験者の認知課題成績の分析。心理学者125人の論文掲載誌の分析。web閲覧ログの分析。いずれもパス。

 。。。数分の一も理解できていないんけど、これ、要するに個体パラメータの分布をマルチモーダルにできるような階層モデル、みたいなもんなのであろう。そいでもって、実は無限個の潜在クラスを想定していて、潜在クラスへの所属を潜在ディリクレ配分みたいにディリクレ分布で説明しているのであろう。なんだかしらないけど、ふうん、そうなんすか。

 つまんないことだけど、心理学のジャーナルに載っているのに心理学における個人差モデルの先行研究が全然出てこないが、ちょっと意外。キャッテルのなんとかテクニックとか、認知発達の個体記述的モデルとか、そういうのは引用されず、むしろ機械学習系の論文が多数挙げられている。世の中広い。

論文:データ解析(2015-) - 読了:Navarro, et al. (2005) ディリクレ過程に基づく個人差モデリング

Goldstein, M. (2006) Subjective Bayesian Analysis: Principles and Practice. Bayesian Analysis, 1(3), 403-420.
 先日ちょっとベイズ統計について話す機会があって(神を恐れぬ所業)、その資料作成のついでにめくった奴。

 「客観ベイズ」主義者どもが幅を利かせる今日この頃ではあるが、主観主義的ベイズアプローチこそが、多くの実用的問題に対する唯一の実現可能な解なのだっ!という、意見論文というか、哲学的エッセイというか。
 整理の都合上ざっと目を通したけど、雲をつかむような話だし、すごく眠いし、全然内容が頭に入ってない。特に4.1節の、主観主義理論にとってprimitiveは確率じゃなくて期待値なのだ... という話からのくだり、一体何を云っているのかさっぱり理解できなかった。残念だけど、またご縁がありましたら、ってことで。。。

 専門家の信念を確率分布として表現する方法について、 Garthwaite, Kadane, & O'Hagan (2005 JASA)というのを挙げていた。南風原「続・心理統計学の基礎」でも挙げられていた奴だ。読まなきゃ。

論文:データ解析(2015-) - 読了:Goldstein (2006) 主観ベイジアン宣言

« 2016年7月 | メイン | 2016年9月 »

rebuilt: 2020年11月16日 22:40
validate this page