elsur.jpn.org >

« 読了: Masyn (2008) イベント発生時間の測定誤差を考慮した離散時間生存モデルを一次マルコフモデルでつくろう (というか、Mplusでつくろう) | メイン | 読了:「聖書考古学」「経済学になにができるか」 »

2013年6月26日 (水)

Tan, P.N., Kumar, V., Srivastava, J. (2004) Selecting the right objective measure for association analysis. Information Systems, 29, 293-313.
 先日読んだ Lenca et al. (2008)に引き続き、ふたつの二値変数AとBのあいだの関連性の指標を比較検討する研究。とりあげる指標は:

で、こうした指標に期待される性質として、著者らは以下を挙げる。

以上の性質でもって指標を分類すると、以下の6グループにわけられる。

  1. オッズ比、YuleのQ, YuleのY。
  2. コサインとJaccard。
  3. サポートとLaplace。
  4. ファイ係数、collective strength, Piatetsuky, Shapiro。
  5. ジニ係数とラムダ。
  6. リフト、Added value, Klosgen。
  7. 相互情報量、Certainty factor, カッパ。

著者いわく、3, 6, 7番目のグループはなんだかよくわからんけど、きっと注目した性質が足りないからでしょう、とのこと。

 論文の残りの部分は...

前半がとても勉強になった。いろいろと 反省すること 多かりし。
 よくわからないのだが、情報工学の方面では、新しいアルゴリズムかなにかを提案しないと論文になりにくいのかしらん。最後のトピックは論文化のためのツケタリではないかと思う。前半のレビューだけで十分に貢献しているのに。根拠レスな言いたい放題がまかりとおる領域ももちろん不健全だが、こういうのはこういうので、ちょっと健康的ではないような気が...

論文:データ解析(-2014) - 読了: Tan, Kumar, & Srivastava (2004) 2x2クロス表の関連性指標を品定め

rebuilt: 2020年4月20日 18:58
validate this page