elsur.jpn.org >

« 読了:Sekhon(2011) RのMatchingパッケージ | メイン | 読了:「人間仮免中」「乙嫁語り」「午前3時の不協和音」 »

2012年5月20日 (日)

Biondi-Zoccai, G., et al. (2011) Are propensity scores really superior to standard multivariable analysis? Contemporary Clinical Trials, 32, 731-740.
 「傾向スコアが標準的な多変量解析よりも優れているってホントですか?」。いやあ,魅力的な題名をつけるのって大事だなあ。
 医療系の論文を読んでいるときに時々面食らうのだけれど、かの世界にはどうやら「統計的手法,それは要因の因果的効果の定量的推定のための手法だ,ほかになにがあろうか」という暗黙の前提があるようで、この論文も、題名には書いてないけど、要するに準実験デザインにおいて共変量を事後的・統計的に調整するための諸手法のレビューである。掲載誌の性質がよくわからなかったのだけど,どちらかといえば統計ユーザ向けの啓蒙的概観であった。仕事の都合で取り寄せて読了。

 標準的な多変量解析ってなんのことよ、という疑問がたちまち湧くが、まあ有り体にいえばそれはロジスティック回帰とCox回帰のことである。もっとも,著者はわざわざ以下の手法を例示していて,レベルが揃っていないので気持ち悪いのだが、臨床研究でどのくらい使われているかというコメントが面白いのでメモ。

へえー。傾向スコアが良くつかわれているのと、SEMやIVが使われていないのが面白いと思った。前に仕事の関係で、朝から晩まで図書館にこもってリハビリテーション関連の日本語論文をめくりまくったことがあるのだけど、そのときの印象では、共変量調整の手法としてはマッチング、層別、ロジスティック回帰、Cox回帰の順にfrequently usedで、あとはみなrarelyないしneverという感じだった。もっとも10年くらい前の話だけど(嗚呼...)。

 で,前半はロジスティック回帰・Cox回帰の注意点(多重共線性の話とか,変数選択の話とか,比例ハザード性の話とか),後半は傾向スコア調整の注意点。傾向スコア算出のためのモデルの適合を調べるのはHosmer-Lemeshow検定,判別能を調べるのはc-統計量を使うのが一般的だが,これには批判もある由(Weitzan, et al., 2005, Pharmacoepidemiol Drug Saf.; とはいえ著者らはこの研究に対して否定的)。
 (※私のような哀れなユーザがなにかの拍子にこのブログを見るかも知れないので,ご参考までに書き留めておくと,c-統計量というのはですね,ROC曲線の下面積のことらしいです。同じことを別の名前で呼ぶのはやめてほしいですよね,まったく)
 いざ傾向スコアを求めたとして,それを使った共変量調整の仕方にもいろいろあるが,代表的手法であるマッチングについて著者らは否定的な書き方をしているて,しかしじゃあなにがいいかという話には触れていなかった。きっと山ほど議論があるのだろう。
 肝心の「どっちが良いか」という問題については,Cepeda et al.(2003, Am. J. Epidemiol.)というシミュレーション研究に全面的に依拠している。いわく,事象生起数が共変量の数の8~10倍以下のときは傾向スコアが有利になり,もっと多い場合にはロジスティック回帰やCox回帰が有利になる由。ううむ,シミュレーションの詳細がわかんないので気持ち悪い。元の論文を読んだ方がよさそうだ。

 えーと,それから,Gelman-Hill本のChap.2をさきほど読了。いやはや,くどい!! どこまで読めるか,ますます自信がなくなってきた。

論文:データ解析(-2014) - 読了: Biondi-Zoccaqi, G., et al. (2011) 傾向スコア vs. その他大勢