読了:加藤・下村・森田 (2022) 依存症の強化学習モデル

加藤郁佳, 下村寛治, 森田賢治(2022) 強化学習を用いた依存症の計算論的精神医学研究. 日本神経回路学会誌. 29(2), 52-64.

 仕事の都合で取り急ぎ読んだもの。我ながら不思議な人生だ。

 まず著者の先生方が公開している研究論文データベースComputational Psychiatry Research Mapの紹介。
 次に、依存症の行動的特徴を強化学習過程の異常として説明する計算論的研究の紹介。挙げられている研究をメモしておくけど、どれも難しそうだなあ。

  • Redish(2004 Science): 最初期の研究。temporal-difference強化学習で報酬予測誤差が狂うというモデル。
  • Dezfouli, et al.(2009 Neural Comput.): average reward強化学習
  • Takahashi, Schoenbaum, Niv (2008 Front.Neurosci.): actor-critic強化学習
  • Keramati, Gutkin (2013 PLoS One): 階層的強化学習
  • Keramati, et al. (2017 Psych.Rev.): 薬物の慢性的な摂取がホメオスタシスに与える影響を強化学習で表現。[雑誌名に目を疑ったが、まじでPsychological Reviewである。どひゃーすげー]

ここまでコカインとかの物質依存。行動依存にも適応できる研究としては…

  • 著者の研究 Shimomura, Kato, Morita (2021 Eur.J.Neurosci.)の紹介。読んでみたけど、私の能力不足でほぼ理解できなかった。時間をかけて原論文を読まんと無理だな、これは。(原論文ならわかるだろうと思っているところが過度に楽観的である)
  • Piray et al.(2010 Neural Comput.): ドーパミン利用率の個人差に注目
  • Redish et al. (2007 Psych.Rev.): 状態表現に注目。主体の内的な状態表現が実際の状態と乖離することでギャンブル依存が再発する
  • Ognibene, Fiore, Gu (2019 NeuralNetworks): 環境の複雑さと認知資源の限界に注目

 全然わかってないけど勉強になりましたです。
 依存症の計算論モデルだなんてごく最近の話だと思っていたのだが、もはやPsychological Reviewに論文がバンバン出てしまっているような世界であることがわかった。やべえな。