« 読了:渡辺・伊藤(2011) 徳冨蘆花に養子に貰われたけどまた返された徳富蘇峰の娘さんが語る追憶の世田谷ライフ | メイン | 読了:Amrhein, Greenland, McShane (2019) 仮説検定よ退場せよ in 2019 »
2019年7月 9日 (火)
Rによる実証分析 ―回帰分析から因果分析へ―
[a]
星野匡郎,田中久稔 / オーム社 / 2016-10-26
刊行時に買ったまま本棚で眠っていたのだけれど、3-6月のセミナーの準備の際に引っ張り出して机の横に積み上げ、しかし残念ながら時間切れで手に取れなかった。本棚に戻す前に、何が書いてあるのかざーっとめくってみた。
前半のうち1-5章は「基礎編」と題して、推測統計学の基礎的な概念の説明をR入門と並行して進める。母集団と標本、記述統計量、確率の基礎、中心極限定理、単回帰と重回帰(まず離散変数のXで層別したYの期待値のプロットを出してこれを「ノンパラ回帰」と呼び、これを線形回帰の導入にする)、仮説検定(μ=0の検定をやったあとでいきなり回帰係数の検定になる。差の検定はやらない)。
6章では、相関と因果は違うんだよという話を枕にして、ルービン的な枠組みを導入して(いきなりトリートメントっていわれて面食らわないかしらん)、ATEを紹介。
7章では内生性について触れ、内生性が生じる原因について、省略変数(omitted variableのこと)、推定誤差、同時性の3つを挙げる。実例として、うまいこと自然実験の形になっていて内生性を克服できた例(Boes & Nuesch, 2001 J.UrbanEcon.), 出生時体重が教育年数に与える効果を一卵性双生児データで推定した例(Behrman & Rosenzweig, 2004 Rev.Econ.Stats.)。
[Boes & Neuschというのはセミナーで使えたな...やっぱり先に読んでおくべきだった...]
後半がこの本のウリだと思う。Angrist-Pischke本のそのまた入門編という感じ。
8章は選択バイアスとランダム化実験。研究例としてテネシー州のProject STARを紹介。[こういうときに教育研究が出てくるというのは、私が院生のころには比較的レアだったような気がする。時代は少しずつ変わっている]
9章はマッチング法。NNマッチング、k-NNマッチング, caliperマッチング, 傾向スコアマッチングもちらっと紹介される。実例はアメリカの絶滅危惧種保護法の効果推定で、野生動物の個体をマッチングする[これおもしろいなあ。Ferraro, McIntosh, Ospina(2007, J.Env.Eco.Mgmt)という論文だそうだ]。
10章はRDD。局所回帰・局所線形回帰で推定する実習。実例はFerreira & Gyourko (2009)という政治学の研究。
11章は操作変数法。2段階最小二乗法をlm()でやる実習(いったんざーっと説明しておいて、あとでRubinの枠組みと結びつけるという順序で進む)。実例はLevitt(1997)という、警察の規模が犯罪件数に与える効果を選挙のタイミングを操作変数にして推定する話であった。
この本が扱う内容とRの基礎トレーニングとは本来全然関係がないので、話を並行して進めるのはちょっと読みづらいんだけど、いろんな制約があるんでしょうね... たぶん学部の講義の教科書として使うことを想定しているのだろう。
後半の各章の末尾にいちいち魅力的な研究例が紹介されているところが勉強になった。毎回うまい例をひっぱってくるのって、なかなか難しいものだと思う。さすがにプロの研究者である。
データ解析 - 読了:「Rによる実証分析」