« 読了:「ハムレット」「二流小説家」 | メイン | 読了:「誰も知らない『名画の見方』」 »
2011年5月30日 (月)
原因の有無を行、結果の有無を列にとった2x2分割表に基づいて因果的効果の強さを調べるとき、各行ごとに結果が生じた割合を求め,行のあいだでその比をとることが多い。疫学でいうところの相対リスク(RR)である。
しかし,列周辺度数が固定されている場合には相対リスクは求められない。たとえば,結果が生じた人を100人,生じなかった人を100人集めてきました,というような場合がそうだ(医学の分野ではこういうのをケースコントロール研究という)。その場合は代用としてオッズ比を使いなさい、とモノの本には書いてある。オッズ比とは,行ごとに右の列と左の列の比を求め,行のあいだでその比をとったもののこと。これはカテゴリカルデータ分析の初歩的な知識で、俺も社員研修などでは必ず話す。
しかし、オッズ比が相対リスクを近似するのは、結果の生起割合が0に近い場合に限られる(rare disease assumption)。そりゃ医学統計の人はいいでしょう,結果はたいてい発症や死亡で、生起割合はたいてい低いから。でも調査データ分析一般において,いったい生起割合がどのくらい低ければ、オッズ比を相対リスクとして解釈してかまわないのか? 自分のなかであいまいなままやりすごしていたのだが、たまたまその話を解説している記事があったので読んでみた。3頁の短い記事だが、かまうものか、なんでも記録しておくのだ。
Davies, H.T.O, Crombie, I.K., Tavakoli, M. (1998) When can odds ratios mislead? British Medical Journal, 316, 989-991.
オッズ比はRRよりも極端な方向にずれる。つまり、(a)1を下回る場合はRRより小さく、(b)1を上回る場合にはRRより大きい。著者いわく、(a)の場合、解釈上の実害はさほどない(0.5を半分にしたって0.25、数字がそんなにかわらないから)。しかし(b)の場合には誤解を生むことがある(2の倍は4、数字が大きく変わる)。
オッズ比とRRのずれは、原因がないときの生起割合(初期リスク)が大きいほど大きくなり、オッズ比が1から離れている時ほど大きくなる。オッズ比が1より大きい場合、だいたいの目安として、初期リスクとオッズ比をかけた値が100%以下なら、オッズ比はRRの2倍以下におさまっている... とのこと。
いまwebでみたら,この記事には批判コメントが寄せられていて,いわく,著者らはデザインのことをちゃんと考えていない。そもそも実験やコホート研究ならばRRを算出すればよい。いっぽうケースコントロール研究の場合,対照群を適切に抽出しているならば(incidence density sampling),生起割合が高くったってオッズ比はRRを表す。
ちょっと検索してみたところ,rare disease assumptionは古典的な固定コホートを前提にした議論で,動的コホートを前提にした議論では,ケースコントロール研究のデータが曝露オッズを保持したまま抽出されているのなら,生起割合がどうであれオッズ比はすなわちRRである由(Greenland&Thomas,1982)。。。そういえばこの話,前にどこかで読んだような気がしてきた。勉強してもなかなか身に付かない。イヤになっちゃうなあ。
論文:データ解析(-2014) - 読了:Davies, et. al. (1998) オッズ比がまずいのはどんなとき?