「論文：データ解析」カテゴリーアーカイブ

読了: Rodriguez-Rondon & Dufour (2024) MSTestパッケージをインストールしなさい。マルコフ・スイッチング・モデルのレジーム数についての本当の検定というものをお見せしますよ

　このたび仕事で時系列のレジーム・スイッチング・モデルの話に取り組んでいたんだけど、困ったのが、ある時系列についてわざわざレジーム・スイッチを考える必要があるのかないのか、どうやって判断すんの？という問題であった。(あまりに初歩的な疑問で、なんだか恥をさらしているような気がする…)

　きっとなにかしら検定のような方法があるはずだ。でも、直観的には、単にレジーム数1のモデルと2のモデルのあいだで尤度比検定してはいけないような気がする。しかし、なぜそう思うのか自分でもうまく説明できない。
　RにはMSTestというパッケージがあって、レジーム数についての検定をご提供します、って書いてある。お、これじゃん。ところが、出力の見方がさっぱりわからない。思い余ってChatGPTくんに尋ねてみると、いいえ、RのMSTestパッケージとはマルチ・ステージ検定のパッケージです、マルコフ・スイッチング・モデルのレジーム数については、2つのモデルの間での尤度比検定が可能ですと断言し、Rのコードと出力例を示してくる。しかし、どうみてもシンプル過ぎるコードと雑な出力で、疲れている私の目から見ても疑わしい。ひとこと「ほんとですか？」と問い返すと、しばらく考えたのちに「申し訳ありません、検定はMSTestパッケージによって可能です」と反省のそぶりを見せるが、今度はありもしない関数の使い方を説明してくる。
　キレるよ？夜中にブチギレちゃうよ？？？
続きを読む →

読了: Visser & Speekenbrink (2010) RのdepmixS4パッケージへの招待

Visser, I., & Speekenbrink, M. (2010). depmixS4: An R Package for Hidden Markov Models. Journal of Statistical Software, 36(7), 1–21.

　RパッケージdepmixS4のvignette。上記はJSSの論文だが、実際にはパッケージ添付のvignetteを読んだ。
　実戦投入検討前のセレモニーとして大急ぎでめくった奴なので、ほとんどの部分をちゃんと読んでいない。
続きを読む →

読了: Torkamani & Lohweg (2017) 時系列モチーフ発見入門

Torkamani, S., & Lohweg, V. (2017) Survey on time series motif discovery. WIRES Data Mining and Knowledge Discovery, 7(2).

　仕事の都合で読んだ奴。時系列モチーフ発見についての短い解説。この分野について全然知らんので、まずは易しそうなやつから目を通した。でも、数式が全く出てこないというのも、それはそれで怖いなあ…
続きを読む →

読了: Muthen & Asparouhov (2020) ランダム切片つきの潜在遷移分析

Muthen, B., Asparouhov, T. (2020) Latent Transition Analysis with Random Intercepts (RI-LTA). Psychological Methods, 27(1), 1-16.

　仕事の都合で手に取った。Mplusの開発元であるMuthenチームが提案しているランダム切片潜在遷移分析(RI-LTA)の論文。
　説明が丁寧でとても読みやすいし、内容も面白いのだが、ちょっといま時間がないもので、おおまかな主旨がわかったところで中断した。記録の都合で読了にしておくけれど、いつか必要になったら読み直そう、ということで…
続きを読む →

読了: Kuschning & Vashold (2021) BVARパッケージで君も楽しくVARモデルを経験ベイズ推定しようぜ

Kuschning, N., Vashold, L. (2021) BVAR: Bayesian Vector Autoregressions with Hierarchical Prior Selection in R. Journal of Statistical Software, 100(14).

　RパッケージBVARの解説。これ、いまやりたいこととはちょっと違うんだろうなとうすうす感じてはいたのだが、どんな話か気になって。
続きを読む →

読了: Osmundsen, Kleppe, Ogland (2019) マルコフ・スイッチングVARモデルをStanやJagsや自力で実装する方法

Osmundsen, K.K., Kleppe, T.S., Ogland A. (2019) MCMC for Markov-switching models—Gibbs sampling vs. marginalized likelihood. Communications in Statistics – Simulation and Computation.

　仕事の都合で、マルコフ・スイッチングVARモデルについてあれこれ考えているのだけれど、組みたいモデルを推定できるソフトがなかなか見当たらない。RではかつてMSBVARというパッケージがあったのだけれど、開発が止まったようで、CRANからもremoveされている。
　これは自力で書けっていうこと？到底そんな学力はない。Stanでどうにかする？でも離散潜在変数ってめっちゃ難しいんじゃなかったっけ… と思い悩みながらwebの海をさまよっていたら、Stanでの実装を示している人がいた。いわく、詳細はこの論文を読め。はい、読みます。
続きを読む →

読了: Bucci, Palomba, Rossi (2022) ベクトルロジスティック平滑遷移自己回帰モデル(VLSTAR)への招待

Bucci, A., Palomba, G., Rossi, E. (2022) starvars: An R Package for Analysing Nonlinearities in Multivariate Time Series. R Journal, 14, 208-226.

仕事の都合でマルコフ・スイッチング・モデルについて調べていて、試しに読んでみたやつ。Rのstarvarsパッケージのvignetteにあたるもので、R Journalの記事である。
続きを読む →

読了: King, Mgyen, Ionides (2016) 部分観察マルコフ過程のRパッケージpomp

King, A.A., Ngyen, D., Ionides, E.L. (2016) Statistical Inference for Partially Observed Markov Processes via the R Package pomp. Journal of Statistical Software, 69(12), 1–43.

仕事の都合でマルコフ・スイッチング・モデルについて調べているんだけど、CRAN Task ViewsのTime Seriesで挙げられているマルコフ・スイッチング・モデルに関係しそうな雰囲気のパッケージとしてNTS, MSwM, depmixS4, pompがある。このうちpompってやつが一体なにやってんのか全然わかんなかったので、試しにvignetteをめくってみた。おそらく同内容の論文がJ. Statistical Softwareに載っている(上記)。
続きを読む →

読了: 沖本(2014) マルコフ・スイッチング・モデルとはなんぞや

沖本竜義(2014) マルコフスイッチングモデルのマクロ経済・ファイナンスへの応用. 日本統計学会誌, 44(1), 137-157.

　仕事の都合で読んだ。マルコフスイッチングモデルについての啓蒙論文。
　著者はあの「経済・ファイナンスデータの計量時系列分析」を書いた先生。難しい話を丁寧に説明することにかけて、私のなかで絶対的な信頼を誇る先生である。こういう素晴らしい研究者の方が、貧困をなくす研究とか戦争を止める研究とかではなく、ファイナンスなどという金持ちの手先のようなご研究をなさっているのは、人類にとっていかがなものなのか。(すいません冗談です)
続きを読む →

読了: Park, Gelman, & Gafumi (2004) Mr.Pによる選挙予測

Park, D., Gelman, A., Gafumi, J. (2004) Bayesian Multilevel Estimation with Poststrafication: State-Level Estimates from National Polls. Political Analysis, 12, 375-385.

　みんな大好きミスターPことMRP (マルチレベル回帰・層別)の初期論文。googles様的には被引用回数589件。なお、一般にMr.Pの提案論文と称されているGelman & Little (1997)は411件である。
続きを読む →

読了: Morris, Wheeler-Martin, Simpson, Mooney, Gelman, & DiMaggio (2019) 階層空間モデルのひとつBesag-York-MollieモデルをStanで推定する方法

Morris, M., Wheeler-Martin, K., Simpson, D., Mooney, S.J., Gelman, A., DiMaggil, C. (2019) Bayesian hierarchical spatial models: Implementing the Besag York Mollié model in stan. Spatial and Spati-temporal Epidemiology. 31.

最近の調査データ分析でよく使われるみんな大好きミスターPことMRPについて調べていると、空間構造を入れるという話があって、そりゃまああるだろうとは思うのだが、そこに出てくるBYM2モデルというのになじみがなくて面食らった。調べてみたら、Gelmanさんたちが「StanでBYM2モデルをどう書くか」というチュートリアル論文を出しておられたので、パラパラめくってみた。
　本題は3節のStanコードの紹介なのだが、単にBYM2モデルってどんなんなのかを知りたいだけないので、申し訳ないけど3節以降はパス。
続きを読む →

読了: Sutton, Almquest, & Wakefield (2025) COVIDワクチンの小地域接種率をMRPと空間MRPで推定してみたけどからっきしダメでした

Sutton, A., Almquist, Z., Wakefield, J. (2025) Evaluating Multilevel Regression and Poststratification with Spatial Priors with a Big Data Behavioural Survey. arXiv:2503.05915.

先月arXivにあがったプレプリント。普通のMRPと空間MRPを実データで比べるという、関心にジャストフィットな話だったので、試しに読んでみた。JRSS Series Aに投稿中だと書いてあるが、ほんとだろうか。単にlatexのテンプレートがそうなっているだけなのかも。
続きを読む →

読了: Gelman & Little (1997) 階層ロジスティック回帰を使った事後層別推定 (のちにいうMr.P)

Gelman, A., Little, T.C. (1997) Poststratification Into Many Categories Using Hierarchical Logistic Regression, Survey Methodology, 23(2), 127-135.

　00年代の選挙予測でブイブイいわせ、いまでは調査データ分析の標準的ツールにまで成り上がってしまった、ご存じミスターP(MRP, マルチレベル回帰・層化)の元論文としてよく引用されるもの。掲載誌はカナダ統計局の地味ーな雑誌である。
　MRPの解説はいまや巷に溢れているから、別にいまこれを読むことはないんだろうけど、調べ物のついでに読んだ次第である。温故知新！
続きを読む →

読了: Little (1993) 調査データ解析における事後層別について、予測モデリングの観点から解説しよう

Little, R.J.A. (1993) Post-Stratification: A Modeler’s Perspective. Journal of the American Statistical Association, 88(423), 1001-1012.

　統計学者Little先生による、調査における事後層別(post-stratification)についての解説。伝統的なデザイン・ベースの説明ではなく、モデル・ベースの観点から説明するというのがミソである。
　良く引用される論文で、前から気になっていたのだがずるずると後回しになっていた。このたびちょっと調べ物をしていて、その流れで思い出し、試しに読んでみた。別にいま読まなくてもいいっちゃいいんだけど、この一週間体調を崩して寝込んでいたので、そのリハビリを兼ねている。
　途中で気が付いたけど、これ、招待講演を元にした論文なんですね。講義を思わせるちょっとカジュアルな書きぶりである。
続きを読む →

読了: Gao et al.(2021) MRP(マルチレベル回帰・層化)に構造化事前分布をいれる

Gao, Y., Kennedy, L., Simpson, D., Gelman, A. (2021) Improving multilevel regression and poststratification with structured priors. Bayesian Analysis, 16(3), 719-744.

　2020年にプレプリントを読んでメモをとっていた奴。このたび事情により公刊版を読み直したので記録しておく。
　なお、ついでにメモも取りなおした。自分の古いブログ記事を修正するのって、なんだか妙なものだ。物好きにもほどがあるという気がする。

読了: Broniecki, Leeman, & Wuest (2022) MrPで地域レベル変数が多すぎるとき、機械学習でいい感じにやる方法

Broniecki, P., Leemann, L., & Wuest, R. (2022) Improved Multilevel Regression with Post-Stratication Through Machine Learning (autoMrP). The Journal of Politics, 84(1), 597–601.

　先日仕事の都合で読んだ奴。みんな大好きMr.Pことマルチレベル回帰・事後層別を機械学習で改善しますという話。RパッケージautoMrPの元論文である。
　これ、以前から読もうと思っていたのだけど、勤務先の同僚が読んでくれていたので放置していたのである。トシを取ると多様な言い訳を思いつくようになることがわかる。
続きを読む →

読了: 坂地ほか (2024) 人工知能学会誌「ナラティブと人工知能」特集号

武富有香・須田永遠 (2024) 物語の読解技術とその応用－文学研究におけるナラティブ－. 人工知能, 39(5), 588-594.
土井智暉・谷中瞳 (2024) 自然言語処理を用いたナラティブ分析の可能性. 人工知能, 39(5), 608-614.
坂地泰紀・塩野剛志・金田規靖・新谷元嗣 (2024) 経済におけるナラティブ. 人工知能, 39(5), 651-657.

昨年9月の人工知能学会誌「ナラティブと人工知能」特集号より。仕事の都合で読んだ。ほんとは所載の13本を全部読んだんだけど、全部書くのは手間なので、特に面白かった3本をメモしておく。

読了: Quinn & Bederson (2011) ヒューマン・コンピュテーションを分類する

Quinn, A.J., & Bederson, B.B. (2011) Human Computation: A Survey and Taxonomy of a Growing Field. CHI’11: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems. 1403-1412.

ヒューマン・コンピュテーションについてのレビュー。誰かと話していてうっかりヒューマン・コンピュテーションという言葉を使ってしまい、自分もよく意味がわかっていないな… と思って読んだ奴。google様によれば被引用回数1182なんだけど、この分野では13年前の国際会議発表なんて古文書に近いでしょうね…
続きを読む →

読了: 矢野 et al.(2024) 日本語の文埋め込みモデルを文書検索・RAGの文脈で比べる

矢野千紘, 塚越駿, 笹野遼平, 武田浩一 (2024) 日本語文埋め込みの文書検索性能と検索補助付き生成での評価. 言語処理学会発表論文集, 2024/03.

　理解できたかどうかは別にして、読んだものはなんでも記録しておこうということで…
　文書検索における文埋め込み手法の性能を比較したという発表。文埋め込みを使った密ベクトル検索、およびRAGに注目する。意外にも、日本語での評価は「ほとんど行われていない」由。えええ、そういうもんなんですか？
続きを読む →

読了: 美馬 et al. (2022) N-of-1 研究入門

美馬達哉, 小金丸聡子, 芝田純也, 佐藤岳史 (2022) N-of-1研究をどう行うか. リハビリテーション医学, 59, 1111-1117.

　勉強のつもりで目を通した啓蒙論文。
続きを読む →

読書日記

読んだ本を淡々と記録します