« 読了:Surachartkumtonkun, et al. (2013) 顧客の激怒のバック・ストーリー | メイン | 読了:狩野(1998) 探索的因子分析の不適解はなぜ起きるか、どう対処するか »
2016年8月26日 (金)
ほんとはいまそれどころじゃないんだけど、前に取ったメモを忘れないうちに記録しておく。(現実逃避)
McEntegart, D.J. (2003) The pursuit of balance using stratified and dynamic randomization techniques: An overview. Drug Information Journal, 37, 293-308.
実験研究で対象者を条件に割り付けるとき、無作為割り当てに頼っていてよいか? 重要な共変量については標本設計の段階で条件間できちんとバランスさせておいたおいたほうがよいのでは?それはなぜ?そしてどうやって?... という話題があって、その医薬統計向け解説。医学分野での実験では、多施設で同時に実験するとか、対象者が徐々に増えていくとか、そういう特有の事情があって、案外話題が尽きない模様なのである。
雑誌の性質はよくわからないが、NACSISで所蔵館17館だから、そんなに妙なものではないだろう。現誌名はTherapeutic Innovation & Regulatory Science となっているらしい。
以下、内容メモ。
標本設計の段階で予後因子[共変量のことね]を条件間でバランスさせるのはなぜか。
- その最大の理由は統計的効率性だ、と長く考えられてきた。70-80年代には"splitter"と"lumpers"の対立があった(Grizzle, 1982 Control.Clin.Trials)。前者は標本設計の段階でバランスさせる派、後者はモデルで事後調整する派。で、現在は両方やるのが良いというのが主流。
- 統計的効率性という観点から見て、ほんとにデザインでバランスさせる必要があるのか。特にサンプルサイズが大きい場合、ちゃんと無作為割り当てしてればそれで十分ではないか。[いろいろ議論が紹介されて...]要約すると、大規模多施設試験で施設を層別変数にする場合を別にすれば、たいていの場合、わざわざ標本設計の段階でバランスさせる必要はない。
- しかし、標本設計の段階でバランスさせるのはなにも統計的効率性のためだけじゃないだろう。「バランスを得る目的は、(その可能性は低いにせよ)極端なアンバランスが起きてしまうという事態に対する、低コストな保険であるとみなすことができる」。[...というわけで、著者は標本設計時にバランスさせることのメリットを箇条書きで8個も挙げている。MECEなリストとは言い難いが、なにかのときに役に立ちそうだ]
バランスを保ちつつ無作為割り当てする方法。
- Central randomization with constraints. [ここ、いまいちぴんとこないので原文をメモしておく]
A simple form of randomization is to allocate subjects the next medication from a list sectioned into blocks where each block balances treatment in multiples of the desired allocation ratio.
[たとえば実験条件P,Qがあって、目標とする割り当て割合が1:1だったら、PQ, QPという2種類のパーミュテーションブロックをつくり、これをランダムに並べたベクトルをつくり, 全施設がこのひとつのリストを左から順に使っていく... ということだと思う。うーん。これってふつう「ブロック無作為化」って言わない?]
この方法では、施設やそのほかの要因はバランスできない。バリエーションとして、Zelenのbalanced blocked randomization (施設内での割付が極端にならないようにする)がある。 - 層別パーミュテッド・ブロック無作為化。製薬会社がいちばんよく用いている方法がこれで、ふつう施設を層別変数にする。ほかの層別変数をいれることもある(施設と要因をクロスしたやつを層にする)。
ふつうは試験開始前にブロックの割り当てを決める。でも次のように動的に決めていくこともできる[以下、勝手に解釈してメモ]。条件はPとQだとしよう。指令所がパーミュテーションブロック PQ,QP のランダムな並びを持っている。試験スタート。施設Aに男の対象者がはじめて入ってきました。施設Aは指令所に連絡して、ブロックをひとつもらってきて男用にする。それがQPだったら、その対象者はQ, 次の男の対象者はP。次の男の対象者が来たら、また連絡してブロックをもらってくる。このやりかただと、途中で施設を追加するのも容易。
研究レベルでみると条件間で厳密なバランスはとれない(多少ずれたって検定力は落ちないけど)。各層のサイズがブロックサイズにくらべて十分に大きければ、2条件への割り当ての差の95%信頼区間は、±1.96√{(層の数)(ブロックサイズ+1)/6}で近似できる[←んんん? 施設のほかに層別変数がないとして、施設数8、ブロックサイズ2なら条件間で±4人くらいのずれがでるってこと?]。2条件の場合、層の数はせいぜい対象者数/(4xブロックサイズ)までにしておけという意見もある。 - mixed無作為化。層別ブロック無作為化の変形で、二重盲検化してない試験で予測可能性を減らすために用いる。[予測可能性の問題には関心がないのでパス]
- 最小化(minimization)。すごくよく使われている。Scott et al.(2002)を参照せよ。[...仕組みの説明とシミュレーション研究の紹介があって...] 要因のクロスについてはバランスが取れない。変形として、Signorini et al. の階層動的バランシング法というものある(施設内でバランスが取れる)。
利用上の注意点。量的変数についてバランスさせるときは、頻度が同じ程度になるような、5水準くらいに離散化するとよいだろう。頻度が小さい水準があるとそこが重視されるので気を付けるように。[ほか、いろいろ書いてあるけど、あんまし関心のない話が多いのでメモ略] - 壺デザイン (urn designs)。たとえばP,Qの2条件、層別変数なしとして、最初の対象者はp=0.5で割り付ける。これを壺からの球のドローと捉える。各壺のなかのP色の球の数、Q色の玉の数をwとする。ドローした球はすぐに戻し、さらにその色の球をα個、違う色の球をβ個加える。α<βにすればするほど速くバランスが取れる。層別変数をいれる場合は...[めんどくさいのでメモ略]。壺デザインはあんまし使われてないけど、割り当て確率がインバランスの程度と比例するという魅力がある。
- 最適デザイン。回帰モデルによる処理効果の推定値の分散を最小化することを目指す。AtkinsonのDA最適化法がある(1982 Biometrika; 1999 Stat.Med.)。いちいち逆行列を出さないといけないが、それを改善した変形もある。非統計家に説明にしくいのが欠点で、使っている研究をみたことがないが、簡略化した方法を使ったという報告はある。
手法選択における考慮ポイント。
- バランスという観点からいうと...[まあそうだろうなという感じの話。略]
- 予測可能性という観点からいうと... [関心ないのでパス。しかし、医学統計においては予測可能性って大問題なんだなあ...]。
- 検定力という観点からいうと...
- Tu et al (2000 Drug.Info.J.)が実データから抽出する実験をやって最小化と層別を比較している。分析モデルが正しいとして、共変量間の交互作用があるときは、最小化の成績は層別より落ちる。交互作用がなくてもやはり落ちるが、サンプルサイズが大きいと変わらなくなる。しかしこの研究はいろいろ問題があって、たとえばブロックサイズを2にしてるけど、著者の製薬会社における経験によればふつうブロックサイズはもっと大きいし [... とケチをつけている。パス]
- Weir & Lees (2003 Stat.Med.)は層別無作為化よりも最小化が優れていると示している。でも共変量の交互作用がないと仮定したシミュレーション研究だから、ま、そうなるよね。
- Quinaux et al.(2001 Conf.)は打ち切りのある生存データで層別無作為化と最小化を比べ、大差がないといっている。
分析について。厳密に言えばrerandomization testをやるのが正しい。著者もFDAにそう命じられたことがある。いっぽう、対象者参加順の時間トレンドがない限り、バランスさせた要因を分析に含めれば、標準的な検定でよいという意見もある。こっちのほうが多数派で、シミュレーションで支持する報告もある。当局にrerandomizationで検定しろって突っ返されるのがどうしても嫌だったら別だけど、黙って標準的検定をやってりゃいいんじゃないでしょうか。
云々。
。。。この話、市場調査にすごく縁の深い話なんだけど、これまでにきちんとした解説をみたことがない(たいていの市場調査の教科書は社会調査のアナロジーで書かれており、統制実験という視点が乏しいからだと思う)。また、詳しくはちょっと書きにくいけど、実査現場でものすごく奇妙な慣習が横行している領域でもある。これは実査側の問題でもあり、発注側の問題でもあるので、いつかきちんとまとめたいものだ。。。(現実逃避)
論文:データ解析(2015-) - 読了:McEntegart (2003) 共変量の分布をバランスさせつつ実験条件に対象者をうまく割り当てる方法レビュー