« 読了:Hoeffer (2003) 消費者に革新的新製品のコンセプトを評価してもらう際に使用場面を心的にシミュレーションしてもらったら評価が正確になる、といいなあ | メイン | 読了:Westfall, Troendle, & Pennello (2010) 多重マクニマー検定 »
2015年2月 3日 (火)
岩崎祐貴, 折原良平, 清雄一, 中川博之, 田原康之, 大須賀昭彦 (2015) CGMにおける炎上の分析とその応用. 人工知能論文誌, 30(1), 152-156.
ネット上の「炎上」を機械学習で予知するという研究。第一著者は現在サイバーエージェント所属の若い方。
内容メモ。数式によくわからない箇所があって、表記を勝手に少し変えてます。失礼をお許し下さいませ。
著者らいわく、ネット上の炎上は犯罪自慢型、Struggles between conflicting values型(「価値観押しつけ」型, SBCV型)、暴露型の三タイプにわけられる。このうちSBCV型の炎上の予測を試みる。具体的にはtwitterの分析である。
まず、ある所与のトピックについての世評を動的に数値化する方法を考える。時点$t$におけるトピック$I$についてのtweetの総数を$A_I(t)$とする。これを辞書マッチングによって肯定$P_I(t)$, 否定$N_I(t)$, 中立$E_I(t)$に分類する。期間$T$における話題$I$の日次極性を
$DP_{I,T}(t) = \{ P_I(t) - N_I(t) \} / \{ \sum_{i \in T} A_I(i) \} $
とし、これを$T$における最大値で割って $NDP_{I,T}(t)$とする。呟きが炎上するのはその極性がその時点での世評の蓄積と対立しているからだろう、というわけで、過去のNDPの影響を積分した値を持つ指標「割引累積日次極性」DCNDPを定義する。ここの式がよくわからないんだけど、たぶん
$DCNDP_{I,T}(t) = \sum_{i=1}^{\infty} 0.95^{i-1} NDP_{I,T}(t-i)$
という主旨なのであろうと思う。0.95というのは忘却を表す係数。
つぎに、炎上ツイートを集めるモデルをつくる。SBCV型で炎上したといえる呟き(A)を人力で20件収集。当該の呟きをしたアカウントの2013年上半期の呟きを収集。各アカウントの被RT数の40倍を超えた呟き(B)は123件[どうやらここにはAは含まれていないらしい]。うち17件が炎上している[ちょ、ちょっと待って、ではBでいう炎上の定義は???]
A20件+B123件=計143件、うち炎上37件。これを学習データとし、決定木(WekaのJ48)に放り込む。説明変数は、アカウントのフォロー数、フォロアー数、平均非RT数とこの正規化、平均非Fav数とその正規化、平均ツイート数(正規化)、当該発言の極性、味方率(当該発言をリツイートした人におけるフォロアーの割合)、有名人か(アカウントがWikipediaに載ってるか)。できた決定木をみると、たとえばフォロアー数11755以下のアカウントの味方率11%以下のツイートは22件中22件が炎上、だそうだ。ひゃー。
さて、日本のフォロアー数ランキング上位5000アカウントについて、学習データと同じ手順で1533件を収集、ブログ更新情報などでない235件(C)をテストデータにして上の決定木にあてはめると、炎上しているはずのツイートが24件。「真の炎上tweetについて調査したところ、適合率100%、再現率93%であった」とのこと。[←ここもよくわからない。真の炎上tweetはどう定義したのか]
上のモデルでは「味方率」という説明変数が効くんだけど、これは投稿前にはわからないので、投稿時点のDCNPDに取り換えてモデルを組みなおす[←あ、そういう筋なのね... DCNPDがいつ使われるのかわからず混乱した]。こんどはA+B+Cの378件のなかから53件(うち炎上22件)を抽出し、J48に食わせたところ、発言の極性とDCNDPだけを使う単純な決定木となった。予測精度94%。
興味深い内容であった。大変勉強になりました。
提案手法の使い方として想定されているのは、有名人のクライアントが投稿する瞬間に炎上確率を予測し警告する、というような用途ではないかと思う。無名の高校生がバイト先の冷蔵庫に入った写真を投稿して炎上、というようなのは視野の外にある。
感想:
- 用いたデータはすべて一定の被RT数を持っているようだ。でも被RT数は投稿時点ではわからないわけで、被RT数で絞らないテストデータに対する予測成績が知りたいなあ。
- 2個目のモデルでは「ジェンダー・政治思想・宗教・社会/国際問題をトピックとして持たないもの」を選んでいるんだけど、世間の「価値観押しつけ型」炎上のうち、それらがトピックでない事例はどのくらいあるのかしらん。
この研究によれば「価値観押しつけ型」炎上は投稿内容と世評のposi-nega極性のズレなわけだ。価値観の対立ってのは、発言のposi-nega極性で表現できるような単純なものかなあ? と疑問に思う面もある。
北朝鮮の拉致被害者が帰国した頃、評論家の故・栗本薫さんが「被害者の方々の北朝鮮での苦難の日々のなかにも、それぞれの豊饒な生があったのではないか」という意味のことを発言して大炎上したことがあった。しかし、おそらく「拉致被害者」についての世評の極性はpositive, この発言の極性もやはりpositiveだろう。極性のズレでは説明がつかない例だ。
いや待てよ、栗本さんの発言は「被害者の人生は悲劇ではない」という形で流通して叩かれていたような気もする。この形なら、なるほど、辞書マッチング的な意味での極性がズレているわけだ。炎上なんて案外その程度に単純な、言葉尻の問題なのかもな、と思う面もある... うーむ。
論文:マーケティング - 読了:岩崎 et al. (2015) ツイッター上の炎上を予知する