Dutwin, D., Buskirk, T.D. (2017) Apples to Oranges or Gala Versus Golden Delicious? Comparing Data Quality of Nonprobability Internet Samples to Low Response Rate Probability Samples. Public Opinion Quarterly, 81, 213-249.
これも2017年POQ「サーヴェイ調査の明日」特集号より。
タイトル通り、確率標本ではないネットパネル調査と、確率標本ではあるが回収率が低い調査のどっちがいいかという地獄のような話題である。第一著者はSocial Science Research Solutionsという調査会社の人。もの知らずなものでタイトルの表現がよくわからなかったのだが、GalaとGolden Deliciousというのはリンゴの品種らしい。
(イントロダクション)
先行研究では、非確率標本の調査より確率標本のほうが調査結果は正確であり、調査結果の差は小さいこともあるが大きいこともある、ということが示されている。[←こうメモすると当たり前すぎて笑ってしまうけど…]
非確率標本の補正方法のうち、伝統的なレイキング(IPF)はバイアスを小さくすることもあれば大きくすることもある。傾向スコアやマッチングについても検討されているが、いずれも特効薬とはいえない。
[とかなんとか、背景がだらだらと書いてある。えーいスキップだ]
データ
データは以下の通り。特記ない限り2012/10-2014/10。
- Panel 1: Luth社によるCentris survey of communication, entartainment, and telephony. 非確率的ネットパネルに対する調査である。
- Telephone 1: SSRS社による国レベルのdual-frame RDDオムニバス調査。
- Telephone 2: SportsPoll社による18-54歳のdual-frame RDD調査。
- Panel 2: Research Now社によるsports-tracker 調査。これも非確率的ネットパネル。
- NHIS (Nathinal Health Interview Survey) 2013年。
Panel 1, 2はトラッキングなので複数回回答者がいるんだけどどれか1回を使う。
マッチングの際には2013 US Current Population Survey(CPS)をソースとする。バイアス評価の「正解」として2012 American Community Survey (ACS)を使う。
手法
[どういう論文なのかだいたい見当がつくような気がしてきた。急速に関心が薄れたのでまるごとスキップ]
結果
[スキップ。著者の先生すいません]
考察と結論
…というわけで、たしかにネットパネル調査の(unweightedの)バイアスは確率標本より大きいし、SDも大きい。デモグラでレイキングしてもバイアスは残る。傾向スコアウェイティングとマッチングでも解決しない。
[とかなんとか… すっごくダラダラ書いてあるので途中で投げ出した。すいません]
—————–
論文のあとに質疑応答がついてるんだけど、めんどくさいので読まなかった。
POQって、ときどきこういう「やったらこうなりました」研究が載るんだよなあ。いや、それはそれで社会的意義が大きいということもわかるんですけど。