elsur.jpn.org >

« Mplus 7.2の改訂点 | メイン | 読了: Halay & Baldinger (2000) ARF広告プリテスト妥当性プロジェクト »

2014年6月24日 (火)

Grun, B., Hornik, K. (2001) topicmodels: An R package for fitting topic models. Journal of Statistical Software, 40, 13.
 Rの topicmodels パッケージの解説。ぱらぱらめくっただけだけど、整理の都合上読了にしておく。

 細かいことだけど、モデル選択のくだりで説明されているperplexityについてメモ(これ、訳語はあるのかしらん?)。単語集合$w$のperplexityは
 $Perplexity(w) = \exp \{ - \log(p(w)) / \sum_d \sum_j n^{(jd)} \}$
 $n^{(jd)}$というのは文書dで語jが出現する回数。ホールドアウトした$w$に対してperplexityが低いとありがたい。ふうん。要するに、語の尤度を均して負にしたようなもんだろうな。

論文:データ解析(-2014) - 読了: Grun & Hornik (2001) topicmodels パッケージ