読書日記: 読了：Davies, et. al. (1998) オッズ比がまずいのはどんなとき？

« 読了：「ハムレット」「二流小説家」 | メイン | 読了：「誰も知らない『名画の見方』」 »

2011年5月30日 (月)

　原因の有無を行、結果の有無を列にとった2x2分割表に基づいて因果的効果の強さを調べるとき、各行ごとに結果が生じた割合を求め，行のあいだでその比をとることが多い。疫学でいうところの相対リスク(RR)である。
　しかし，列周辺度数が固定されている場合には相対リスクは求められない。たとえば，結果が生じた人を100人，生じなかった人を100人集めてきました，というような場合がそうだ(医学の分野ではこういうのをケースコントロール研究という)。その場合は代用としてオッズ比を使いなさい、とモノの本には書いてある。オッズ比とは，行ごとに右の列と左の列の比を求め，行のあいだでその比をとったもののこと。これはカテゴリカルデータ分析の初歩的な知識で、俺も社員研修などでは必ず話す。
　しかし、オッズ比が相対リスクを近似するのは、結果の生起割合が0に近い場合に限られる(rare disease assumption)。そりゃ医学統計の人はいいでしょう，結果はたいてい発症や死亡で、生起割合はたいてい低いから。でも調査データ分析一般において，いったい生起割合がどのくらい低ければ、オッズ比を相対リスクとして解釈してかまわないのか？自分のなかであいまいなままやりすごしていたのだが、たまたまその話を解説している記事があったので読んでみた。3頁の短い記事だが、かまうものか、なんでも記録しておくのだ。

Davies, H.T.O, Crombie, I.K., Tavakoli, M. (1998) When can odds ratios mislead? British Medical Journal, 316, 989-991.
　オッズ比はRRよりも極端な方向にずれる。つまり、(a)1を下回る場合はRRより小さく、(b)1を上回る場合にはRRより大きい。著者いわく、(a)の場合、解釈上の実害はさほどない(0.5を半分にしたって0.25、数字がそんなにかわらないから)。しかし(b)の場合には誤解を生むことがある(2の倍は4、数字が大きく変わる)。
　オッズ比とRRのずれは、原因がないときの生起割合(初期リスク)が大きいほど大きくなり、オッズ比が1から離れている時ほど大きくなる。オッズ比が1より大きい場合、だいたいの目安として、初期リスクとオッズ比をかけた値が100%以下なら、オッズ比はRRの2倍以下におさまっている... とのこと。

　いまwebでみたら，この記事には批判コメントが寄せられていて，いわく，著者らはデザインのことをちゃんと考えていない。そもそも実験やコホート研究ならばRRを算出すればよい。いっぽうケースコントロール研究の場合，対照群を適切に抽出しているならば(incidence density sampling)，生起割合が高くったってオッズ比はRRを表す。
　ちょっと検索してみたところ，rare disease assumptionは古典的な固定コホートを前提にした議論で，動的コホートを前提にした議論では，ケースコントロール研究のデータが曝露オッズを保持したまま抽出されているのなら，生起割合がどうであれオッズ比はすなわちRRである由(Greenland&Thomas,1982)。。。そういえばこの話，前にどこかで読んだような気がしてきた。勉強してもなかなか身に付かない。イヤになっちゃうなあ。

論文：データ解析(-2014) - 読了：Davies, et. al. (1998) オッズ比がまずいのはどんなとき？

読書日記

読んだ本を淡々と記録します

2011年5月30日 (月)