« 読了:Tappin, et al.(2017) 確証バイアスと望ましさバイアス、どちらが深刻か?(あるいは:トランプ勝利を予測できなかったのは頭のせいかハートのせいか?) | メイン | 読了:Ridgeway, Kovalshik, Griffin, Kabeto (2015) それが標本ウェイトつきのデータなら、傾向スコアを求める際にも標本ウェイトを使え »
2017年8月21日 (月)
Thoemmes, F.J., & Kim, E.S.(2011) A Systematic Review of Propensity Score Methods in the Social Science. Multivariate Behavioral Research, 46, 90-118.
傾向スコア調整を使っている心理・教育系論文を集めてレビューし教訓を垂れます・イン・2011、という論文。わーい、心理・教育系だいすきー。だって数学が苦手な人が多いんだもんー。(すいません)
まずイントロとして傾向スコア概説。いくつかメモしておくと、
- 推定した傾向スコアの使い方としては、マッチング、層別、ウェイティング、モデルに共変量として投入、がある。このうち共変量として使用する路線は、傾向スコアの効果が線形でなかったらどうするんだ、処理変数と交互作用があったらどうするんだという批判がある。Weitzen, et al.(2004 Pharmacoepidemiology and Drug Safety)を見よ。
- 傾向スコアモデルの中心的特性は共変量バランスと共通サポート領域だ[後者は、処理水準間で共変量の分布がちゃんとオーバーラップしているかどいうことだと思う]。共変量バランスは検定でチェックされることが多いが、Cohenのdを使えという批判も多い。ただしそれにも注意が必要で、たとえば、マッチさせる前と後で同じSDを使わないといけない。Stuart(2008, 書籍)をみよ。絵を描くのもいいぞ。
- 共通サポート領域を絵にかくのも大事。Imai, King, & Stuart (2008 JRSS), King & Zeng (2007 Int.Studies.Q.)をみよ。
- 傾向スコアでマッチングした後で検定するとき、対応のない検定を使えという説と対応のある検定を使えという説がある。前者はStuart, Schafer & Kangら、後者はAustinら。[←この話題、以前もどこかで見かけたんだけど、こんな簡単そうな話題でも意外に揉めるもんなのね...]
心理教育系で傾向スコアを使っている論文を111本集めてコーディングし集計。ちゃんと読んでないけど、えーっと、傾向スコアの推定方法は78%の論文がロジスティック回帰でやっている。共変量選択についてはちゃんと書いてないのが多い。傾向スコアの使い方はマッチングが64%(やり方はいろいろ)で、以下、層別、ウェイティング、共変量投入と続く。云々、云々。
というわけで、諸君、以下の点を改善したまい。
- 傾向スコア推定のために集めた変数と使った変数の一覧を付録につけなさい。[←ははは。でもわかるよ、できれば書かずに済ませたいという気持ちも]
- マッチングの場合、1:1マッチングのほかにもいろいろあるから勉強しなさい。
- 傾向スコアの推定はロジスティック回帰以外にもいろいろあるから勉強しなさい。ブーステッド回帰木とか(McCaffreyのやつ)、遺伝的マッチングとか(Diamond & Sekhon, 2005 Webに落ちているみたい)。
- 共変量のバランスはちゃんとチェックしなさい。もちろん検定じゃだめだよ。Austin(2009 Stat.Med.)を読みなさい。
- 共通サポートもちゃんと調べなさい。
... 傾向スコアの使い方として時々みかけるdoubly robust推定って、あれどうなんすかね、なんか書いてあるといいな、と思いながらめくっていたのだが、残念ながら載ってなかった。
論文:データ解析(2015-) - 読了:Thoemmes & Kim (2011) 心理・教育系研究における傾向スコアの使われ方レビュー