elsur.jpn.org >

« 読了:丸岡(1998) ラダリング法の現在 | メイン | 読了: Marcoulides, & Saunders (2006) PLSは銀の弾丸ではない »

2012年7月 2日 (月)

Greenland, S. (1989) Modeling and variable selection in epidemiologic analysis. American Journal of Public Health, 79(3), 340-349.
 回帰モデリング(ロジスティック回帰とかCox回帰とかも含む)における諸注意事項をまとめたコメンタリー。重回帰の変数選択をクラシカルかつスマートにやることが鍵になるような仕事を抱えていて、面倒な作業の山の前でだんだん士気が落ちてきたので、気分転換のつもりで読んだのだけれど、これがまた面倒な内容で、ますます士気が落ちた。なんでこんな古いのを読まねばならんのかとも思うが、ステップワイズ変数選択がなぜ悪いかというような「枯れた」話題になると、新しい文献にはかえって説明が見つからないのである。
 変数選択のところで面白かったのは、変数の有意性に基づくステップワイズ選択と、Change-in-esimate法でのステップワイズ選択を比較しているところ。後者は、独立変数のなかに注目している奴があって(これを投入することは確定している)、その係数が変わるかどうかで他の変数(共変量)の投入の是非を判断するやりかた。そういうやり方があることは知っていたが、伝統的な変数選択法と比較しようという発想がなかった(まるきり違う話題だと思ってた)。思うに、疫学では独立変数がリスク要因への曝露変数と共変量とにアプリオリに分かれていて、「曝露の効果を正しく推定するためにどうやって共変量を選択するか」という点だけが問題になるから、この二つの手法は同じ目的を持つことになるのだろう。機械的な変数選択そのものが良くないという話を別にすれば、Change-in-esimate法のほうが優れている由。いまちょっと調べてみたら、SASのproc regやproc glmselectではできないようだが、誰かがつくったマクロがあるらしい。Rではどうだかよくわかんなかった。

論文:データ解析(-2014) - 読了:Greenland (1989) 疫学における回帰モデルと変数選択