読書日記: 読了: Puhani (2002) ヘックマンの二段階推定とその批判

« 読了: Bushway, Johnson, Slocum (2007) 魔法じゃないのよヘキットは | メイン | 読了: Toomet & Henningsen (2008) sampleSelectionパッケージ »

2014年2月11日 (火)

Puhani, P.A. (2002) The Heckman correction for sample selection and its critique. Journal of Economic Survey, 14(1), 53-68.
　先に目を通したBushway, Johnson, Slocum (2007) で何度も引用されていた論文。面白そうなので目を通した。

　まず、Heckmanの二段階推定についての簡にして要を得た説明(計量経済学の和書など読んでないで、まずこれを読めばよかった...)。次に、批判者の論点を紹介。

　批判その一、Two-part model。Heckmanは選択バイアスの下で観察される従属変数 $y_1$を
　$y^*_1 = x'_1 \beta_1 + u_1$
　$y_1 = y^*_1 if y^*_2 > 0$
　$\ldots$
という風にモデル化したわけだが(個体を表す添字 $i$ を略記)、そうじゃなくて最初から
　$y^*_1 | y^*_2 = x'_1 \beta_1 + u_1$
　$y_1 = y^*_1 if y^*_2 > 0$
　$\ldots$
という風に考える。こういう考え方をTwo-part model(TPM)という。著者いわく、TPMを支持する意見はさらに3つに分かれる。

TPMは$y^*_1$の条件付き期待値についてのモデルだ。我々が関心を持っているのはそれでしょ？
TPMはHeckmanと同じく、選択の過程をモデル化しており、違いは分布の想定だけだ。TPMでは$y^*_1$のunconditionalな残差分布として混合分布を想定していることになるのだ。
Heckmanのモデルの$x'_1$も、TPMでの$x'_1$も、まあ似たようなもんじゃないですか、という実に荒っぽいご意見。

　批判その二。Heckmanの方法では、上のモデルに加えて
　$y^*_2 = x'_2 \beta_2 + u_2$
というモデルを立て、ここから逆ミルズ比を求め、従属変数が観察されているサブサンプルのOLS回帰式に放り込む。でも、$x_2$ が$x_1$と異なる変数を含んでいない限り (exclusion restrictionsって奴ですね)、逆ミルズ比は$x_1$と高い相関を持ち、従ってマルチコが生じる。

　批判その三。$u_1$と$u_2$について二変量正規分布を想定するのは強すぎる。セミ・パラないしノン・パラな方法を使うべし。

　さて、Heckmanの二段階推定(ないし、FIMLによる一発推定)と、サブサンプルのOLSを比較したモンテカルロ・シミュレーション研究がすでにたくさんある由。それらの結果を表にしてまとめましたのでご覧ください、というのがこの論文のメインディッシュ。著者のまとめによれば、とにかくexclusion restrictionsを与えよう、それが無理なら、単にサブサンプルでOLS推定したほうがいいんじゃない？とのこと。

　プラクティカルなアドバイスに関しては、この後に出たBushwayらのレビューのほうが詳しいんだけど、説明がわかりやすくて、勉強になりましたです。

論文：データ解析(-2014) - 読了: Puhani (2002) ヘックマンの二段階推定とその批判

読書日記

読んだ本を淡々と記録します

2014年2月11日 (火)