« 読了:Cain, et al. (2011) 左側打ち切りと左側切断が生存分析に与えるバイアス | メイン | ウェイティング回顧録 (私は結構ヒマな男なのではないか) »
2015年6月11日 (木)
Hu, S.S., Balluz, L., Battaglia, M.P., Frankel, M.R. (2011) Improving Public Health Surveillance Using a Dual-Frame Survey of Landline and Cell Phone Numbers. American Journal of Epidemiology, 173(6), 703-711.
ちょっときっかけがあって、仕事の合間に目を通した。ほんとはこんなことしてる場合じゃないんだけど...
アメリカでBehavioral Risk Factor Surveillance System (BRFSS)という調査をやっている。健康状態とかリスク行動とかについて月次でトラッキングする全米規模のRDD調査だ。ところが、最近じゃ「携帯しか持ってない」という世帯が増えているので、固定電話対象のRDDでよいものかという疑問がある。そこで、2008年に固定と携帯のdual-frame調査の実験をやってみた。そのご報告。
固定RDDのほうは通常のBRFSS調査と同様の手順(従って携帯ユーザも含まれている)。携帯RDDのほうはまずスクリーナで「携帯しか持ってない」人を特定した。他にも、居住州が怪しいのでスクリーナで改めて州を訊かなきゃとか(いちおう番号で州がわかるんだけど、その番号のまま引っ越してることもある)、いろいろめんどくさいことがある由。票単価が全然違っちゃうので(固定の5倍近いそうだ)、最適割当の式を睨み、州ごとに全標本の1割を携帯に割り付けた。
さて、以下の手順でウェイティングします。
まずはデザイン・ウェイト。固定のほうは次の3つのファクターを掛ける。(1)当該州での電話番号の抽出確率の逆数。(2)世帯の成人数。(3)世帯の固定回線数の逆数。携帯のほうは、当該州での電話番号の抽出確率の逆数。
次に、固定と携帯を統合するためのウェイト。州別に、SESで事後層別して合わせるウェイトをつくり、さらに州ごとの電話使用者の推定サイズにあわせるウェイトもつくる。後者のウェイトのつくりかた、超めんどくさいけど、きちんとメモしておくと... まず別の大規模な調査(2007 NHIS)のデータで、成人を次の4群に分類する:(1)固定電話のみ、(2)固定と携帯の両方、(3)携帯のみ、(4)どちらもなし。この電話使用群を従属変数、ソシオグラフィク・デモグラフィック変数を予測子にした国レベルの多項ロジスティック回帰モデルを組む。そのモデルを、また別の調査(2005-2007のAmerican Community Survey)に当てはめ、各州における電話使用群のメンバーシップ確率を予測し、各州の電話使用群のサイズを推定する。なんと面倒な話だろう。死人が出るレベルだ。
最後に最終ウェイトの作成。各州について、年齢x性別(州によってはこれに地域や人種がはいる)を表側、{固定のみ・両方・携帯のみ}を表頭にとった表について周辺分布をあわせる。Proceedings of the SAS Global Forum 2009 Conference に載っているSASマクロを使ってレイキングした。
回答率と結果についていろいろ述べているけど、パス。
考察。携帯電話への調査は金がかかる。回答率は州による。携帯電話のみの人には酒飲み、喫煙者、肉体労働従事者、HIVテスト経験者が多く、金がなくて十分な医療を受けていない人が多く、健康保険に入ってない人が多く、肥満は少なくインフルエンザワクチンとかマンモグラムとか受けてない人が多い(散々だなあ...)。年齢・性別・人種・学齢・収入などを調整してもこの傾向は消えない。要するに、固定電話のみのRDDで事足れり、ってやりかただと結構やばい。というわけで、BRFSSは2009年からdual-frameのRDDをやってます、とのこと。
ふへぇー。世の中にはいろんな問題があるものね。。。
論文:調査方法論 - 読了:Hu, et al. (2001) 固定電話対象のRDD調査と携帯電話対象のRDD調査を両方やってひとつにまとめました