elsur.jpn.org >

« 読了:06/24まで (F) | メイン | 読了:07/01まで (C) »

2007年7月 1日 (日)

Johnson, J.W. & LeBreton, J.M. (2004) History and use of relative importance indices in organizational research. Organizational Research Methods, 7, 3, 238-257.
マイナーな雑誌なので入手に困ったが,著者様が送ってくれた。ありがとうございました。
 相対的重要度についての特集号に載ったレビュー(そんな特集号があるのね)。ここで相対的重要度というのは,ある結果側変数と複数の原因側変数を押さえている調査データを使い,それぞれの原因側変数に相対的な重要度を割り当てたい,でも原因側変数同士に相関があるので偏回帰係数は使い物にならない,さあどうしようか,という話。紹介されているのは,
(1)単回帰ベースの指標(r,b,β,t,R2増加量,βr)
(2)重回帰ベースの指標(部分相関の二乗のモデル間平均;偏相関の二乗のモデル間平均;BudescuのDominance指標;Anzen&Budescuのcriticality指標)
(3)いったん直交変数に変換する方法(Greenらのδ;著者らのε)
 わかりやすくまとめてくれていて,大変助かった。この論文のおかげで霧が晴れた思いである。
 もっとも,このテーマにはほかのアプローチもあると思う。主成分回帰やPLS回帰のように次元縮約するやり方もあるし,リッジ回帰という手もあるだろう。事前知識やグラフィカル・モデリングを使い,独立変数間の関係について正面からモデル化しちゃう路線もあるだろうし,データが大きければニューラルネットだっていけそうだ。その意味では狭い範囲に限定したレビューなのだが,ま,なにもかも人に頼ってはいけないよな。

Johnson, J.W. (2000) A heuristic method for estimating the relative weight of predictor variables in multiple regression. Multivariate Behavioral Research, 35,1,1-19.
 上の論文でεという指標がお薦めされていたので(まあ自分が提案した指標だからな),国立の図書館に出張してコピーしてきた。数学苦手なのに,こんな雑誌の論文を読む羽目になろうとは。しかも自分でプログラムを書かねばならんのか,と途方にくれていたら,著者様がサンプルプログラムを送ってくれた。尋ねてみるものだ。ありがたやありがたや。
 εというのはこういう指標である。変数X1,X2,...,Xkについて,まず,「ひとつひとつにぴったりフィットしつつも直交している」変数Z1,Z2,...,Zkをつくる(こういう手続きをなんていうのかね。直交化?) で,こいつらからYに対して重回帰する。いっぽう,ここが味噌なのだが,こいつらからX1,X2,...に対しても重回帰する。要するに三層のネットができて,真ん中の層(Z)から上の層(Y)と下の層(X)への矢印が延びるわけである。で,XiからYに行くすべての経路(k本)の係数の二乗和を,Xiの重要度とする。
 ZからXにパスが延びる,というのは妙な感じだが,そこのところの理屈づけはない。とにかく結果をごらんあれ,Dominance Analysisと似た結果になるでしょう? でもDominance Analysisは2^k回の重回帰をかけなきゃいけないから,kが大きいとき計算できないでしょう? この方法ならkが大きくても大丈夫よ,というストーリー。
 このあいだEdwards&Bagozziの論文を読んでいたら,うかつにformativeな測定モデルを組んではいけない,X1,X2,...にひとつづつ潜在変数Z1,Z2....を与え(これが真値),ZiからXiへのパスを引き,その上でZiから構成概念へのパスを引きなさい,そうすればXiの誤差がモデルに組み込めるでしょう,という話があった。この論文のモデルはその話に似ていると思う。この著者にとってZiはただの道具的な変数に過ぎないんだろうけど,もっと積極的に意味づけられないものだろうか。まあどうでもいいけどさ。

 思うに相対的重要度などというものは,ピュアな統計学者なら見向きもしない不純な概念なのだろうと思う。今回いろいろ調べていて偶然みつけたのだが,Kruskal&Majorsの相対的重要度レビュー論文に対して,Ehrenbergという人がこんなコメントを寄せている。"I think, however, that they have missed an important factor, which is that only unsophisticated people try to make such assessments." そうかunsophisticated peopleか,と笑ってしまった。
 確かに,この人が書いているとおり,"As soon as the relationships in question come to be better understood [...], the discussion turns, I think, to modelling the processes and their possible causal mechanisms as such, rather than their relative 'importance.'" なのである。因果的身分が異なる変数群を一緒にし,さあどれが重要か,と問うのはナンセンスなのだ。
 しかしその一方で,(たとえば)顧客満足度を左右する特性がk個ある,特性間の関係についてはどうでもいい,注力すべきなのはどれなんだ!という切実なニーズに,全く応えないわけにもいかない。このギャップを埋めるためには,まず相対的重要度が必要とされる状況を概念的に整理し,分類しておいたほうがいいんじゃないかと思うのだが,うーん,難しくて手に負えない。

論文:データ解析(-2014) - 読了:07/01まで (A)

rebuilt: 2020年4月20日 19:04
validate this page