elsur.jpn.org >

« 読了:12/08まで (A) | メイン | 読了:12/15まで (C) »

2009年12月10日 (木)

Kromrey, J., Hogarty, K.Y. (2000) Problems with probabilistic hindsight: A comparison of methods for retrospective statistical power analysis. Multiple Linear Regression Viewpoints, 26(2).
ここんところ,事後的効果量に関する文献を読みあさっていたが,いいかげん飽きてきた。。。これはせっかく集めたので一応目を通してみた論文。もうこれでやめにしようと思う。
みたこともない誌名だが,American Educational Research Assoc. のGLM分科会で出している雑誌らしい。細かいところはすっとばして読了。著者らはたしか,SASのユーザ会でも同じような発表をしていたと思う。
標本効果量に基づく検定力算出を支持する立場に立ち,標本効果量をそのまま母効果量とみなすことによって生じる偏りをどうやって補正するかを検討している。非心パラメータ(母効果量)の推定量として,プラグイン推定量,不偏推定量,パーセンタイル推定量の3つがあるのだそうで,それらの偏り・標準誤差・信頼区間をシミュレーションで比較する。一長一短である由。

先日読んだHoenig&Heisey(2001)は,まさにこの論文のようなタイプの研究を次のように批判している。

実験後の検定力分析を「改善する」ためのさまざまな提案がなされてきた。たとえば,一般的な効果量(例,非心パラメータ)の推定値が偏っているからその偏りを補正しようとか,検定力算出において使用されている標準誤差は正確にはわかっていないので実験後の検定力推定量の信頼区間を算出しようなどという提案である。奇妙な話だ。検定の結果を評価する際には検定力について検討することを求めるのに,検定力が適切かどうかを評価(検定)する際には,「検定力の適切さ」の検定の検定力について考慮しようとは思わず,推論の枠組みを信頼区間ベースの枠組みに切り替えてしまうのである。これらの提案は,根底にある「検定力アプローチのパラドクス」[検定力が高いことが,棄却されなかった帰無仮説を支持する証拠の強さを意味しないというパラドクス]を解決するための役には立たないという点で,不十分なものである。

。。。なんだかこっちのほうが説得力があるなあ。

Faul, F., Erdfelder, E., Buchner, A., Lang, A.G. (2009) Statistical power analyses using G*Power 3.1: Test for correlation and regression analyses. Behavior Research Methods, 41, 1149-1160.
いつのまにかリリースされていたG*Power 3.1の新機能についての紹介論文。なんと,このブログを読んだ友人のIくんがわざわざメールで教えてくれた。感謝,感謝です。
G*Power 3.1では,いまやロジスティック回帰やポワソン回帰の係数についての検定の検定力まで計算できるのである。俺には当面使い道がなさそうだけど,そんなものまで計算できちゃうとは驚きだ。早速インストールしました。

このブログを誰が読んでいるのかわからないが,ひょっとすると検索エンジン経由で誰かの役に立つかもしれないので,最近の痛恨の体験談を書いておこう。特定の標本サイズと母効果量の下での検定力を求める,というような課題ではなくて,たとえば任意の標本サイズから検定力を引く表といったような,いろいろな場合についての検定力の一覧表をつくるためにはどうしたらよいか? てっきりG*Powerでは無理だと思いこみ,そういうときはSASのpowerプロシジャを使っていた。アサハカであった。あとで気がついたのだが,最初に出てくるメインウィンドウではなく,X-Yプロットのウィンドウで,好きな一覧表を一発でつくれるのだ。気づかないよ,そんなの。。。

論文:データ解析(-2014) - 読了:12/10まで (A)