elsur.jpn.org >

« 読了:04/29まで (F) | メイン | 読了:05/03まで (C) »

2008年5月 3日 (土)

 2要因以上のunbalancedなANOVAでは,ある水準についてのunweightedな平均(SASのproc glmでいうmeans)と重みつき平均(lsmeans)の値が異なる。事後の多重比較で用いるべきはどちらだろう?
 森・吉田の本は前者を比較する方法を紹介しているが,それは前者のほうが手計算しやすいからだと思う。この本の基になっているKirkの本は,不揃いになった理由が処理水準と無関係な欠損である場合は前者でよいとか,その不揃いさが母集団の比率を反映しているのなら後者がよいとか述べていたと思うが(小牧「データ分析法要説」によればWinerもそういっているらしい),この2つのどちらでもないケースも少なくないと思う。
 そもそも,unweightedな平均を比較してよい理由がよくわからん。本来は常にlsmeansを使うべきなのではないか?

 ほんとはこんな古い話題に頭を悩ませていないで,もうちょっと新しい方法を考えるとか(混合モデルを使うとか),あるいはもっとオカネになることを勉強するとか,あるいはもっと楽しいことを考えるとか...いろいろあるだろうに。知りもしない分野で専門家づらしている悲劇。この問題を解決したところで誰が喜ぶわけでもないという悲喜劇。

 考えてみたら,こんな疑問はありふれたFAQのはずだ。どこかに解説論文があるにちがいない。悩んでいないでさっさと検索すべきだな。

雑記:データ解析 - 覚え書き:今週の悩み事