elsur.jpn.org >

« 読了:Hothorn, et al. partyパッケージ (と愉快な仲間たち) | メイン | 読了:Elith, Leathwick, Hastie (2008) ブースティング回帰木ユーザーズ・ガイド »

2015年12月27日 (日)

Ture, M., Kurt, I., Kurum, A.T., Ozdamar, K. (2005) Comparing classification techniques for predictiong essential hypertention. Expert Systems with Applications. 29, 583-588.
 高血圧のリスク予測をいろんな分類手法でやってみました、という話。いま決定木手法の比較に関心があって、足しになるかと思ってざっと目を通した。

 疾患の結果予測を分類手法でやるってのはいくつか先行研究があって、

 で、本研究は... 694人(うち高血圧患者452人)を後ろ向き(retrospective)に分析し、高血圧群/統制群を予測する。独立変数は、年齢、性、家族病歴、喫煙、リポプロテイン[高脂血症かなんかの指標らしい]、トリグリセリド[中性脂肪のことらしい]、尿酸、コレステロール、BMI。

 選手入場。

 データの75%で学習して残りで検証。検証群における敏感度[高血圧群に占める、それと予測できた人の割合、ということね]、特異度[統制群に占める、それと予測できた人の割合]、適中率を比べると、敏感度はLR, FDA, FDA/MARS,MLPが僅差で勝利、特異度はFDA, MLP、適中率はCHAIDが勝利。学習群における3つの成績をみると、{CART, MLP, RBF}グループ(特異度と適中率が高い)、{FDA, CHAID}グループ(中くらい)、{FDA/MARS,LR.QUEST}グループ(低い)、にわかれる。[←おいおい、それは学習時の話で、検証の成績は全然ちがうじゃん...]
 考察。CHAID, QUEST, CARTは予測についての理解に適するけど、成績がいいのはMLP, RBF。もっと使えばいいんじゃないですか、データを足して学習しつづけることができて便利だし。云々。

 はあ、そうですか...。
 シニカルにいえばこの研究は、持ってるソフトでいろいろやってみたらこんなん出ました、という話である。 もちろんモデリング手法の特徴を知ることはとても大事だし、実データを使った比較研究はそのための大事な手段だ。でも、この論文で取り上げた手法のいずれも、それぞれパラメータ次第でどんどんパフォーマンスが変わってしまうし、実装によっても挙動が異なる。このデータセットでの結果が他のデータセットに対して一般化できるかどうかもよくわからない。勝手な想像だけど、この手の研究に対し、玄人筋の評価は高くならないのではなかろうか。
 いっぽう、私のような無責任なデータ解析パッケージ・ユーザからすると、気楽に読めるという意味で、こういう報告はありがたい面もある。なまじ厳密だが限定的な話をされるより、どこまで信じていいのかわかんないけど親しみが持てる話のほうが、なんとなく得をしたような気がするものである(「示唆が得られた」「考えさせられた」云々)。こういう性向のことを「実務的」と呼ぶ人もいるだろうし、知的な退廃と捉える人もいるだろう。

論文:データ解析 - 読了:Ture et al. (2005) 高血圧患者をいろんな手法で予測してみた