「論文：データ解析」カテゴリーアーカイブ

読了: Valliant (2020) 非確率標本で母集団特性を推定する手法のエキジビジョン・マッチ

Valliant, R. (2020) Comparing Alternatives for Estimation from Nonprobability Samples. Journal of Survey Statistics and Methodology, 8, 231-263.

　非確率標本に基づいて母集団特性を推測する手法をシミュレーションで比較しましたという論文。
続きを読む →

読了: Rueda, Ferri-Garcia, & Castro (2020) 非確率標本のためのRパッケージNonProbEst

Rueda, M., Ferri-García, R., & Castro L. (2020) The R package NonProbEst for estimation in non-probability surveys. The R Journal, 12(1), 406-418.

　ここんとこ非確率標本に基づく推定の話を調べていて、含蓄の深い話が続いて心底くたびれた。リハビリのため、あまり深い話が出てこないであろう資料を手に取った。
　非確率標本のためのRパッケージNonProbEstの紹介記事。要はソフトの機能紹介で、後半はコード例である。癒されるねえ。
続きを読む →

読了: Zhang (2019) 非確率標本に基づく記述的推論

Zhang, L.C. (2019) On valid descriptive inference from non-probability sample. Statistical Theory and Related Fields, 3(2), 103-113.

　都合により読んだ論文。なぜ読んだかというと、これの直前に読んだMeng(2022)がこれを読めと云っていたからである。嗚呼、素直な私。いずれ特殊詐欺とかに騙されるんじゃなかろうか。
続きを読む →

読了: Wu (2022) 非確率標本による統計的推論 (質疑応答編パートII)

Meng, X.L. (2022). Comments on “Statistical inference with non-probability survey samples” – Miniaturizing data defect correlation: A versatile strategy for handling non-probability samples. Survey Methodology, 48(2), 339-360.

非確率標本の分析についてのレビュー論文 Wu(2002) に寄せられた5人の識者によるコメントと著者の返答のうち、4人までは読んだんだけど、残る一人分はコメントとは思えない大論文になっている。こうなったら意地で読むしかない。
続きを読む →

読了: Wu (2022) 非確率標本による統計的推論 (質疑応答編パートI)

Bailey, M.A. (2022) Comments on “Statistical inference with non-probability survey samples” – Non-probability samples: An assessment and way forward. Survey Methodology, 48(2), 313-318.
Elliott, M.R. (2022) Comments on “Statistical inference with non-probability survey samples”. Survey Methodology, 48(2), 319-329.
Lohr, S.L. (2022). Comments on “Statistical inference with non-probability survey samples”. Survey Methodology, 48(2), 331-338.
Wang, Z. & Kim, J.K. (2022) Comments on “Statistical inference with non-probability survey samples”. Survey Methodology, 48(2), 361-366.

　カナダ統計局のSurvey Methodology誌に載った、非確率標本の分析についてのレビュー論文 Wu(2002) には、5人の識者によるコメントと著者の返答が付いている。以下はそのうち4人についてのメモ。残るMengさんのコメントは、20頁近い大論文になってしまっているので、別のエントリで。

　読み返してみるとなんだか喧嘩しているように見えて面白い。論文へのコメンタリーというものはかなりの行数を使って元論文の良いところを挙げるものだが、そういうのは全部端折ってメモしているので、そうみえるのである。いいぞ、もっとやれ。
続きを読む →

読了: Wu (2022) 非確率標本による統計的推論 (レビュー編)

Wu, C. (2022) Statistical Inference with Non-probability survey samples. Survey Methodology, 48(2), 283-311.

　仕事の都合で読んだ奴。非確率標本からの母集団特性推定についての研究レビュー。掲載誌はカナダ統計局の発行。
　本文は35ページ、その後5人の論者による質疑応答がついて、全部で100ページ近い。いや、読みますよ、読みますけどね、いろいろ辛いなあ。
続きを読む →

読了: Sigmund & Ferstl (2019) パネルVARモデルのRパッケージpanelvar、その全内幕

Sigmund, M., & Ferstl, R. (2019) Panel vector autoregression in R with the package panelvar. The Quarterly Review of Economic and Finance.

パネルVAR(ベクトル自己回帰)モデルのためのRパッケージpanelvarの解説。先日、仕事で使おうかなと思う用事があったので、試しにめくった次第。もちろん細かいところは全然理解できていない。
続きを読む →

読了: Rodriguez-Rondon & Dufour (2024) MSTestパッケージをインストールしなさい。マルコフ・スイッチング・モデルのレジーム数についての本当の検定というものをお見せしますよ

　このたび仕事で時系列のレジーム・スイッチング・モデルの話に取り組んでいたんだけど、困ったのが、ある時系列についてわざわざレジーム・スイッチを考える必要があるのかないのか、どうやって判断すんの？という問題であった。(あまりに初歩的な疑問で、なんだか恥をさらしているような気がする…)

　きっとなにかしら検定のような方法があるはずだ。でも、直観的には、単にレジーム数1のモデルと2のモデルのあいだで尤度比検定してはいけないような気がする。しかし、なぜそう思うのか自分でもうまく説明できない。
　RにはMSTestというパッケージがあって、レジーム数についての検定をご提供します、って書いてある。お、これじゃん。ところが、出力の見方がさっぱりわからない。思い余ってChatGPTくんに尋ねてみると、いいえ、RのMSTestパッケージとはマルチ・ステージ検定のパッケージです、マルコフ・スイッチング・モデルのレジーム数については、2つのモデルの間での尤度比検定が可能ですと断言し、Rのコードと出力例を示してくる。しかし、どうみてもシンプル過ぎるコードと雑な出力で、疲れている私の目から見ても疑わしい。ひとこと「ほんとですか？」と問い返すと、しばらく考えたのちに「申し訳ありません、検定はMSTestパッケージによって可能です」と反省のそぶりを見せるが、今度はありもしない関数の使い方を説明してくる。
　キレるよ？夜中にブチギレちゃうよ？？？
続きを読む →

読了: Visser & Speekenbrink (2010) RのdepmixS4パッケージへの招待

Visser, I., & Speekenbrink, M. (2010). depmixS4: An R Package for Hidden Markov Models. Journal of Statistical Software, 36(7), 1–21.

　RパッケージdepmixS4のvignette。上記はJSSの論文だが、実際にはパッケージ添付のvignetteを読んだ。
　実戦投入検討前のセレモニーとして大急ぎでめくった奴なので、ほとんどの部分をちゃんと読んでいない。
続きを読む →

読了: Torkamani & Lohweg (2017) 時系列モチーフ発見入門

Torkamani, S., & Lohweg, V. (2017) Survey on time series motif discovery. WIRES Data Mining and Knowledge Discovery, 7(2).

　仕事の都合で読んだ奴。時系列モチーフ発見についての短い解説。この分野について全然知らんので、まずは易しそうなやつから目を通した。でも、数式が全く出てこないというのも、それはそれで怖いなあ…
続きを読む →

読了: Muthen & Asparouhov (2020) ランダム切片つきの潜在遷移分析

Muthen, B., Asparouhov, T. (2020) Latent Transition Analysis with Random Intercepts (RI-LTA). Psychological Methods, 27(1), 1-16.

　仕事の都合で手に取った。Mplusの開発元であるMuthenチームが提案しているランダム切片潜在遷移分析(RI-LTA)の論文。
　説明が丁寧でとても読みやすいし、内容も面白いのだが、ちょっといま時間がないもので、おおまかな主旨がわかったところで中断した。記録の都合で読了にしておくけれど、いつか必要になったら読み直そう、ということで…
続きを読む →

読了: Kuschning & Vashold (2021) BVARパッケージで君も楽しくVARモデルを経験ベイズ推定しようぜ

Kuschning, N., Vashold, L. (2021) BVAR: Bayesian Vector Autoregressions with Hierarchical Prior Selection in R. Journal of Statistical Software, 100(14).

　RパッケージBVARの解説。これ、いまやりたいこととはちょっと違うんだろうなとうすうす感じてはいたのだが、どんな話か気になって。
続きを読む →

読了: Osmundsen, Kleppe, Ogland (2019) マルコフ・スイッチングVARモデルをStanやJagsや自力で実装する方法

Osmundsen, K.K., Kleppe, T.S., Ogland A. (2019) MCMC for Markov-switching models—Gibbs sampling vs. marginalized likelihood. Communications in Statistics – Simulation and Computation.

　仕事の都合で、マルコフ・スイッチングVARモデルについてあれこれ考えているのだけれど、組みたいモデルを推定できるソフトがなかなか見当たらない。RではかつてMSBVARというパッケージがあったのだけれど、開発が止まったようで、CRANからもremoveされている。
　これは自力で書けっていうこと？到底そんな学力はない。Stanでどうにかする？でも離散潜在変数ってめっちゃ難しいんじゃなかったっけ… と思い悩みながらwebの海をさまよっていたら、Stanでの実装を示している人がいた。いわく、詳細はこの論文を読め。はい、読みます。
続きを読む →

読了: Bucci, Palomba, Rossi (2022) ベクトルロジスティック平滑遷移自己回帰モデル(VLSTAR)への招待

Bucci, A., Palomba, G., Rossi, E. (2022) starvars: An R Package for Analysing Nonlinearities in Multivariate Time Series. R Journal, 14, 208-226.

仕事の都合でマルコフ・スイッチング・モデルについて調べていて、試しに読んでみたやつ。Rのstarvarsパッケージのvignetteにあたるもので、R Journalの記事である。
続きを読む →

読了: King, Mgyen, Ionides (2016) 部分観察マルコフ過程のRパッケージpomp

King, A.A., Ngyen, D., Ionides, E.L. (2016) Statistical Inference for Partially Observed Markov Processes via the R Package pomp. Journal of Statistical Software, 69(12), 1–43.

仕事の都合でマルコフ・スイッチング・モデルについて調べているんだけど、CRAN Task ViewsのTime Seriesで挙げられているマルコフ・スイッチング・モデルに関係しそうな雰囲気のパッケージとしてNTS, MSwM, depmixS4, pompがある。このうちpompってやつが一体なにやってんのか全然わかんなかったので、試しにvignetteをめくってみた。おそらく同内容の論文がJ. Statistical Softwareに載っている(上記)。
続きを読む →

読了: 沖本(2014) マルコフ・スイッチング・モデルとはなんぞや

沖本竜義(2014) マルコフスイッチングモデルのマクロ経済・ファイナンスへの応用. 日本統計学会誌, 44(1), 137-157.

　仕事の都合で読んだ。マルコフスイッチングモデルについての啓蒙論文。
　著者はあの「経済・ファイナンスデータの計量時系列分析」を書いた先生。難しい話を丁寧に説明することにかけて、私のなかで絶対的な信頼を誇る先生である。こういう素晴らしい研究者の方が、貧困をなくす研究とか戦争を止める研究とかではなく、ファイナンスなどという金持ちの手先のようなご研究をなさっているのは、人類にとっていかがなものなのか。(すいません冗談です)
続きを読む →

読了: Park, Gelman, & Gafumi (2004) Mr.Pによる選挙予測

Park, D., Gelman, A., Gafumi, J. (2004) Bayesian Multilevel Estimation with Poststrafication: State-Level Estimates from National Polls. Political Analysis, 12, 375-385.

　みんな大好きミスターPことMRP (マルチレベル回帰・層別)の初期論文。googles様的には被引用回数589件。なお、一般にMr.Pの提案論文と称されているGelman & Little (1997)は411件である。
続きを読む →

読了: Morris, Wheeler-Martin, Simpson, Mooney, Gelman, & DiMaggio (2019) 階層空間モデルのひとつBesag-York-MollieモデルをStanで推定する方法

Morris, M., Wheeler-Martin, K., Simpson, D., Mooney, S.J., Gelman, A., DiMaggil, C. (2019) Bayesian hierarchical spatial models: Implementing the Besag York Mollié model in stan. Spatial and Spati-temporal Epidemiology. 31.

最近の調査データ分析でよく使われるみんな大好きミスターPことMRPについて調べていると、空間構造を入れるという話があって、そりゃまああるだろうとは思うのだが、そこに出てくるBYM2モデルというのになじみがなくて面食らった。調べてみたら、Gelmanさんたちが「StanでBYM2モデルをどう書くか」というチュートリアル論文を出しておられたので、パラパラめくってみた。
　本題は3節のStanコードの紹介なのだが、単にBYM2モデルってどんなんなのかを知りたいだけないので、申し訳ないけど3節以降はパス。
続きを読む →

読了: Sutton, Almquest, & Wakefield (2025) COVIDワクチンの小地域接種率をMRPと空間MRPで推定してみたけどからっきしダメでした

Sutton, A., Almquist, Z., Wakefield, J. (2025) Evaluating Multilevel Regression and Poststratification with Spatial Priors with a Big Data Behavioural Survey. arXiv:2503.05915.

先月arXivにあがったプレプリント。普通のMRPと空間MRPを実データで比べるという、関心にジャストフィットな話だったので、試しに読んでみた。JRSS Series Aに投稿中だと書いてあるが、ほんとだろうか。単にlatexのテンプレートがそうなっているだけなのかも。
続きを読む →

読了: Gelman & Little (1997) 階層ロジスティック回帰を使った事後層別推定 (のちにいうMr.P)

Gelman, A., Little, T.C. (1997) Poststratification Into Many Categories Using Hierarchical Logistic Regression, Survey Methodology, 23(2), 127-135.

　00年代の選挙予測でブイブイいわせ、いまでは調査データ分析の標準的ツールにまで成り上がってしまった、ご存じミスターP(MRP, マルチレベル回帰・層化)の元論文としてよく引用されるもの。掲載誌はカナダ統計局の地味ーな雑誌である。
　MRPの解説はいまや巷に溢れているから、別にいまこれを読むことはないんだろうけど、調べ物のついでに読んだ次第である。温故知新！
続きを読む →

読書日記

読んだ本を淡々と記録します