論文:データ解析」カテゴリーアーカイブ

Roy (2020) MCMC収束診断レビュー

Roy, V. (2020) Convergence Diagnostics for Markov Chain Monte Carlo. The Annual Review of Statistics and Its Application, 7(15), 1-26.

 仕事の都合でちょっと悩んだことがあって、現実逃避のために読んだ奴。
 題名通り、MCMCの収束診断についてのレビューである。正直、そんなに関心ある話題ではないのに、そしてすでにVats, et al.(2020), BDA3の該当部分を読んでいるのに、私にしては勉強熱心なことだ…
続きを読む

読了: Goncalves et al. (2017) BarkerアルゴリズムによるMCMC

Goncalves, F.B, Latuszynski, K., Roberts, G.O. (2017) Barker’s algorithm for Bayesian inference with intractable likelihoods. arXiv.

 本来私なんかが読むような論文じゃないんだけど、ちょっと事情があって前半部分のみ目を通した。すいません、すいません…
 えーと、MCMCではイテレーションのたびに移動を受理するかどうか確率的に決めるじゃないですか。受理の確率を求めるために、MHアルゴリズムの場合だと密度比とかいう式を使いますわね。でもあの式の代わりに別の式を使おうという話があって、そのひとつとしてBarkerのアルゴリズムというのがあるのだそうだ。この論文はその解説。
続きを読む

読了: Merkle, et al. (2021) blavaanパッケージはもはや潜在変数をサンプリングしないことにしたよ。Stanコードをいちいちコンパイルするのもやめたよ

 ここんところ仕事に家事に疲弊していて、残り時間はひたすらぼーっと過ごしていた。時間蠅は矢を好むということわざの通りである。(← 疲れているとろくなことを書かない)

Merkle, E.C., Fitzsimmons, E., Uanhoro, J. Goodrich, B. (2021) Efficient Bayesian Structural Equation Modeling in Stan. J. Statistical Software, 100, 1-22.

 Rのblavaanパッケージ、というのはつまりはSEMのための定番パッケージのひとつlavaanのベイズ版なんだけど、その紹介。実戦投入する前の儀式として読んだ。本論文の前にMerkle & Rosseel (2018, 同誌)というのがあるんだけど、そっちはめんどくさいのでパス。
 私はMplusの忠実な信者なので、lavaan/blavaanなど無視してMplusのみと戯れるシンプルライフを送りたいのだが、なかなかそうも云ってられない事情がある。
続きを読む

読了:Thompson (2018) サーヴェイデータ結合についてのレビュー

Thompson, M.E. (2018) Combining Data from New and Traditional Sources in Population Surveys. International Statistical Review, 87. S79-S89.

 これも仕事の都合で読んだ奴。サーヴェイデータをセンサスとか管理データと結合するという話のレビューである。
 Google様いわく、被引用回数12件。渋い.. 渋いなあ…
続きを読む

読了:Rao (2020) 非確率標本に基づく統計的推測手法レビュー

Rao, J.N.K. (2020) On Making Valid Inferences by Integrating Data from Surveys and Other Sources. Sankhya B: The Indian Journal of Statistics. 83, 242–272.

 これも仕事の都合で読んだ奴。非確率標本に基づく推測に焦点を当てたレビュー。
 ふだんなら読まないジャーナルだけど、著者が小地域推定で知られるラオ先生とあっては目を通さざるを得まい…と思った次第。
続きを読む

読了: Little(2011) Calibrated Bayesアプローチからみた欠損データ分析

Little, R. (2011) Calibrated Bayes, for Statistics in General, and Missing Data in Particular (with comments and a rejoinder). Statistical Science, 26(2), 162-186.

 統計学者Little先生があちこちで提案している Calibrated Bayes アプローチについて調べていて、その一環として読んだ奴。
 良く引用されるLittle(2011)は2012年にメモをとりながら読んでいたのだが、私には話が大きすぎ、いまいち雲をつかむような感じでよく分からなかった。この論文は「欠損データ」と問題が狭く指定されているので、もう少しわかりやすいかと思ったのだが…
続きを読む

読了: Sterba (2009) 母集団のモデルベース推論とデザインベース推論、そしてその統合

Sterba, S.K., (2009) Alternative model-based and design-based frameworks for inference from samples to populations: From polarization to integration. Multivariate Behavioral Research. 44(6), 711-740.

 仕事の都合で読んだ奴。心理学者のみなさん向けに、model-basedの統計的推論とdesign-basedの統計的推論を統合したアプローチを紹介するというもの。
 なお、本文中には統合的アプローチのためのソフトのレビューをonline appendixで提供していると書いてあるが、見当たらない(本文中のURLはリンク切れ)。Mplusとかが紹介してあったようだ。
続きを読む

読了: Elliot & Valliant (2017) 非確率標本に基づいて推測を行うふたつのアプローチ

Elliot, M.R., Valliant, R. (2017) Inference for nonprobability samples. Statistical Science, 32(2), 249-264.

 仕事の都合で読んだ奴。非確率標本からの統計的推測についての概観論文。
 市場調査実務家というのは「統計学の先生のいうことは無作為標本を前提とした綺麗ごとなので僕らの仕事にはあまり役立ちません」「それよりもビジネス理解が大事です」などと言い訳を繰り返していてもなんとかなる気楽な商売なのだが、実際には本論文のように仕事と直結する統計学の研究はたくさんあり、学びうることは多い。あまりに多い。真面目に考えるとなかなか辛い。言い訳を繰り返していた方が健康的かもしれない。
続きを読む

読了: Gelman (2007) ウェイティングと回帰モデリングを巡る悪戦苦闘 (質疑応答編)

引き続き、Gelman(2007) のメモ。

Gelman, A. (2007) Struggles with survey weighting and regression modeling. (with commentaries.) Statistical Science. 22(2), 153-164.

 論文に対して寄せられた5人の識者によるコメントと、Gelmanさんによる返答を読んでみた。
続きを読む

読了: Gelman (2007) ウェイティングと回帰モデリングを巡る悪戦苦闘 (8年ぶり2回目)

 仕事の都合でGelmanらのMRP(マルチレベル回帰・事後層別)についてちょっとだけお話しする機会があって、資料を準備していてふと気がついたんだけど、Gelmanさんが前に書いた”Struggles…”という面白い論文があった。あれはMRPの萌芽だったんじゃないだろうか。あの論文ではそうは呼ばれていなかったけど。

Gelman, A. (2007) Struggles with survey weighting and regression modeling. (with commentaries.) Statistical Science. 22(2), 153-164.

 私は2014年にメモをとりながら読み終えている。メモを読み返してみると、手法提案論文というよりはもっと大きな枠組みを提示した論文なのだが、確かに、MRPの基本アイデア(非確率標本に対する階層回帰と事後層別)が提示されている。
続きを読む

読了:Brown & Maydeu-Olivares (2013) 強制選択課題を用いているおまえらリサーチャーが項目反応理論を勉強しなければならない理由

Brown, A., Maydeu-Olivares, A. (2013) How IRT Can Solve Problems of Ipsative Data in Forced-Choice Questionnaire. Psychological Methods, 18(1), 36-52.

 もういい加減うんざりしてきたんだけど、Thurstonian IRTの論文をもう一本だけ。
続きを読む

読了: Tsai & Bockenholt (2011) 順位付け・一対比較をSEMで分析する、ついでに共変量も別の結果変数も組み込む

Tshi, R.C., Bockenholt, U. (2011) Understanding Choice Behavior Beyond Option Scaling Using Structural Equation Models. Journal of Data Science, 9, 427-444.

 またも一対比較の話。いいかげん飽きてきた…

 Maydeu-Olivares and Bockenholt(2005)を拡張し、順序づけデータの分析をSEMで分析する際に共変量とか含める、という主旨。
 流石に今回は、どんな話かだいたい見当がつくような気がするので、かなり端折ってメモする。
続きを読む

読了:Pritikin(2020) 人々に評価項目ごとにモノとモノとの一対比較をしてもらったデータで評価項目の探索的因子分析をする(RのpcFactorStanパッケージ)

Pritikin, J.N. (2020) An exploratory factor model for ordinal paired comparison indicators. Heliyon, 6.

 一対比較データを扱うRパッケージのひとつにpcFactorStanというのがあって、その元論文。このパッケージを使うつもりはあまりないんだけど、順序尺度の一対比較データから刺激の個人効用を推定する、それもStanで… という点には大いに関心があるので、試しに目を通してみた。
 掲載誌は初めて見たけど、オープン・アクセス・ジャーナル。版元はCell Pressだから、そんなに変な雑誌ではない…と思いたい。
続きを読む

読了:Brown (2014) 一対比較・順序づけ課題のいろんな因子分析モデル・理想点モデルをひとつの枠組みで整理する

Brown, A.(2014) Item Response Models for Forced-Choice Questionnaires: A Common Framework. Psychometrika, 81(1), 135-60.

 先日より一対比較による個人差推定について延々考えているんだけど、もういい加減に飽きてきた…。
 これは参考になるかと思って読んでみた奴。
続きを読む

読了: Brown & Maydeu-Orivares (2012) 強制選択データのThurstoninan IRTモデルをMplusで推定する

Brown, A., Maydeu-Olivares, A. (2012) Fitting a Thurstonian IRT model to forced-choice data using Mplus. Behavior Research Methods. 42(2).

 一対比較データからの個人効用推定の問題で延々と悩んでいる関係で、毒もくらわば皿まで、という気分で読んでみた奴。
続きを読む

読了:野々田・分寺・岡田 (2021) 一対比較で2因子を測定するときの推定方法

野々田聖一, 分寺杏介, 岡田謙介 (2021) 2因子を測定する一対比較型質問紙における推定法. 行動計量学, 48(2), 53-68.

 仕事の都合で延々と一対比較について考えているんだけど(官能評価みたいな古典的場面じゃなくて、むしろ効用の個人差を知りたいような場合の話)、もともとそんなに詳しいわけでも、すごく関心があるわけでもない話題で、正直、ちょっと疲れてきました。
 もっと心安らぐ話はないものだろうか… Web3.0とかさ… 知らんけど…
続きを読む

読了:Tsai(2003) 一対比較データに選好の個人差があるThurstonianモデルを当てはめるときの識別性について

Tsai, R.C. (2003) Remarks on the Identifiability of Thurstonian Paired Comparison Models under Multibple Judgments. Psychometrika, 68(3), 361-372.

 比較課題から刺激の効用を推定するときのモデルの識別性について悩むところ多く、なにかの足しになるかと思って読んでみた。先日読んだMaydeu-Olivares & Bockenholt(2005) で引用されていた論文。
続きを読む