« 読了:「国家はなぜ衰退するのか」「パスタでたどるイタリア史」「孤独な日銀」 | メイン | 読了: Puhani (2002) ヘックマンの二段階推定とその批判 »
2014年2月11日 (火)
勤務先の仕事の関係で、延々と続くデータの前処理を心を無にして片付けながら、ひょっとしたらこの話ってHeckmanじゃない?という疑念が心に浮かぶのを、いやいやそんなことはない、とあわてて打ち消した。いよいよ分析に入ってみると、誰がどうみてもHeckman。どこからどう考えてもHeckman。いやいや!固定観念に縛られてはならないぞ、適切に変数変換すればいいんじゃないか、実はトービット変数だと捉えられないか、欠損のあるSEMの枠組みで行けないか、潜在混合回帰ではどうか、いっそ回帰から離れてみてはどうか、この際データ解析をやめちゃえば...と、散々頭を捻ったが、どんなにごまかしてみても、絵に描いたようなHeckmanとしかいいようがない。計量経済学の教科書に出てくる、回帰モデルにおける選択バイアスの修正(「Heckmanの二段階推定」、またの名をヘキット)を、そっくりそのまま実場面に移したような状況である。嗚呼...
つまらない言い訳だけど、心理学出身者はあんな手法は習わないし使わない。さらにいえば、ふだん使わない手法に手を出すのは、加齢とともにだんだん億劫になってくるのである。
Bushway, S., Johnson, B.D, Slocum, L.A. (2007) Is the magic still there? The use of the Heckman two-step correction for selection bias in criminology. Journal of Quantitative Criminology, 23(2), 151-178.
というわけで、計量経済学の教科書を引っ張り出して付け焼き刃の勉強を済ませ、そのついでに読んでみた論文。人文社会系研究者(すなわち、数学がすごく得意とはいえない人たち)向けの啓蒙的レビューだなんて、誂えたような塩梅である。
なんでも、犯罪の研究ではHeckmanの二段階推定を使うことがすごく多いのだそうだ。なんで?と疑問符で一杯になったが、読み進めてみると、この分野ではたとえば懲役刑の年数を従属変数にした回帰モデルを組んだりするらしい。なるほど、懲役刑になったケースだけを取り出して調べていると、選択バイアスを受けるわけだ。
で、著者らいわく、犯罪研究におけるHeckmanの手法の適用は誤用に満ちている。その例:
- Heckmanの方法では、従属変数が観察されるかどうかを説明するプロビット回帰と、観察された従属変数の値を説明する線形回帰モデルの二本を推定するんだけど、前者のモデルでプロビットじゃなくてロジットを使ってしまっている。(←正直、そんな細かいことを...と思っちゃいました。すいません)
- 二値の従属変数に対してHeckmanの二段階推定を使ってしまっている。(それは確かにやばそうですね)
- Heckmanの方法では、二本目の線形回帰モデルに一本目のモデルから求めた変数を入れるんだけど(逆ミルズ比。要するに観察されるかどうかのハザード比みたいなものだと思う)、そのかわりに観察される確率をいれちゃっている。
- 標準誤差の算出の仕方を間違えている。ちゃんとしたソフトを使いなさい。
その他、二段階推定だけじゃなくて最尤法(FIML)も使いなさい、できるかぎり「プロビット回帰モデルのほうにだけいれる独立変数」を用意しなさい(exclusion restrictionsというそうだ。むしろそれがなくても解が得られるというところがマジカルである)、選択バイアスの大きさを評価する指標があるから使いなさい、云々という仰せでありました。
こういう方法論レビューって、たいてい「統計ソフトのアウトプットを盲目的に使うのはやめなさい」というアドバイスが含まれるものだが、このレビューではむしろ「ちゃんと統計ソフト使って計算しなさい」というアドバイスになっているところが面白い。犯罪を研究している人だって統計ソフトは使うだろうから、おそらくソフトの種類の問題であろう。
論文:データ解析(-2014) - 読了: Bushway, Johnson, Slocum (2007) 魔法じゃないのよヘキットは