« 読了: Stern (2004) アーネスト・ディヒターへの頌歌 | メイン | 読了: Bieman (2006) チャイニーズ・ウィスパー・アルゴリズム »
2013年6月12日 (水)
Kalinka, A.T., Tomancak, P. (2011) linkcomm: an R package for the genratino, visualization, and analysis of link communities in networks of artitrary size and type. Bioinformatics. 27(14), 2011-2012.
webを眺めていたら、職業:データサイエンティスト、という方が書いているブログがあって、勉強になるなあと思って読んでたのだが(というか、データサイエンティストってほんとにいるんだ、とびっくり。一角獣みたいな伝説的存在かと思っていた)、その方がlinkcommというRパッケージを紹介されていた。なんですかそれは? というわけで、探して読んでみた。開発者によるたった2ページの紹介記事。
えーっと、ネットワークを下位のコミュニティへとクラスタリングしていく手法なんだけど、ノードの類似性じゃなくてリンクの類似性を考える。ノード k から i へのノードと k から j へのノードがあったとして、i の一次近隣ノードと j の一次近隣ノードのjaccard係数をリンク間の類似性とする、というのが基本アイデア(前になにかで読んだことがあるなあと思ったら、やはりAhnというポスドクの人のNatureの論文だ)。重みや向きを持つリンクにも拡張できる。でもって階層クラスタリングを行う。いろんな視覚化手法を積んでて、楽しそう。
論文:データ解析(-2014) - 読了: Kalinka & Tomancak (2011) linkcommパッケージ