読書日記: 読了：Pfeffermann (2013) 小地域推定レビュー in 2013

« 読了：「禁忌」「樹脂」「アテネのタイモン」 | メイン | 読了：Schneider(2017) 高齢者の感情評定における回答スタイル・バイアスを多次元項目反応モデルでどうにかする »

2017年12月16日 (土)

　今年の秋は仕事の都合で小地域推定について勉強する羽目になり、これはかなり辛い経験であった。嗚呼人生間違えた、もう残りは早送りにしたい、と思う頻度が、普段だと一日一回くらいなんだけど、この数ヶ月間は敬虔なイスラム教徒のお祈りよりも多いという感じであった。すごい。落ち込む度に腕立て伏せしてたらいまごろムキムキだったのに。

Pfeffermann, D. (2013) New Important Development in Small Area Estimation. Statistical Science, 28(1), 40-68.
　というわけで、個人的な小地域推定ブームの終わり頃に読みかけた長い長いレビュー論文なんだけど、メモを取る余裕もなく、そのうちに用事が終わって関心が失せてしまい、途中で放り出してしまった。
　とはいえ、今回痛感したのは、ああ小地域推定の勉強はしておくべきだ... ということであった。マーケティングのための消費者調査においては、それはそれは大変に身近な話題である(たとえば、認知率が低いブランドのイメージ測定、接触率の低いプロモーションの接触者による評価、いずれも立派な小地域推定問題だ)。なぜこれまでちゃんと勉強していなかったのかね、と臍を噛む思いであった。
　いずれきちんと読む機会もありそうだから、読み終えてないけど読了扱いにして、見出しだけ記録しておく。

1. はじめに
　いわく。2002年に小地域推定のレビューを書いたんだけど、実はそのときは「もう話題として枯れてきたな」と思っていた。9年後のいま振り返るに、私は間違っていた、この研究分野の進展はすごい。この論文ではRao(2003)の本以降の研究についてレビューする。

2. 背景
小地域推定(SEA)とはなにか。モデルベースとデザインベースのちがい。

3. 記法

4. デザインベース手法
4.1 よく使われているデザインベース手法
直接推定量、synthetic推定量、combined推定量。
4.2 デザインベースSAEの最近の進展
calibrated推定量、道具変数を用いた推定量、... [読んでないので見出しも作れない]
4.3 デザインベースSAEのいい点と悪い点

5. モデルベース手法
5.1 一般的定式化
5.2 よく使われているモデル
　エリアレベルモデル、nested errorユニットレベルモデル、混合ロジスティックモデル(対象となる反応が二値のとき)、の3つにわけて紹介。あーあ、もっと早く読んでおけばよかった。
　えーと、エリアレベルモデルの注意点として、推定したい小地域パラメータではなくそれを変換した奴についてモデリングしている場合、モデル自体はEBLUPでも実はEBLUPになっていない、という話が紹介されていた。たとえば$log(\theta)$のEBLUPは$\theta$のEBLUPじゃないでしょ、という話。そうなんだよね... 気がついてはいたんだけど、自分のなかでごまかしていた... その点でFay-HerriotモデルのEBLUPよりもEB(経験ベイズ)やHB(階層ベイズ)のほうが優れているのだそうだ。

ここから全く読んでないけど、
6. モデルベースSAEの進展。
6.1 予測MSEの推定。
6.2 予測区間の計算。
6.3 ベンチマーキング。モデルの誤指定が怖いので、デザインベースと比べる、というような話らしい。
6.4 共変量の予測変数の説明。
6.5 外れ値の対処。
6.6 さらなるrobustificationのためのさまざまなモデルと推定手法。分位点推定とか、罰則つきスプライン回帰を使うとか、ベイズ推定で経験尤度を使うとか、そういう話らしい。そんな話題があるのか...
6.7 順位付きの小地域変換の予測。あらかじめ順番が分かってるというような話かなあ？ちゃんと読まんとわからんな。
6.8 新しい具体的応用。識字率の評価、poverty mapping。

7. 情報的標本抽出・欠損のもとでのSAE。切実な話だけど、いかにも難しそう...

8. モデル選択とチェック。約4pにわたって延々書いてある。ぶひー。

9. 結語。えーと、このレビューは頻度主義の肩をかなり強力に持っているけど、ベイジアンのほうが柔軟な面もある(上でメモした、なにかのリンク関数がはいっているエリアレベルモデルとか)。事前分布の指定は大変だけど、チェックする方法はたくさんある。ベイジアンだと計算が難しい(計算量的にもスキル的にも)という指摘もあるが、それをゆうたらGLMMかて難しいでっせ。にもかかわらずいまだ頻度主義が主流なのは、要するに、公的機関がベイジアンな手法を使うのに躊躇っているからであろう。
　云々。

論文：データ解析(2015-) - 読了：Pfeffermann (2013) 小地域推定レビュー in 2013

読書日記

読んだ本を淡々と記録します

2017年12月16日 (土)