投稿者「elsur」のアーカイブ

読了: Elliot(2009) 確率標本と非確率標本の結合データに疑似ウェイトを振る

Elliot, M.R. (2009) Combining Data from Probability and Non- Probability Samples Using Pseudo-Weights. Survey Practice, 2(6).

 たった7pの短い論文。この掲載誌っていったいなんだろう? オンラインジャーナルらしいけれど。まあとにかく、ときどき引用されているので読んでみた。
 傾向スコアという言葉は使っていないが傾向スコア調整の話である。google様曰く被引用回数93。
続きを読む

読了: Ferri-Garcia & Rueda (2018) 傾向スコア調整とカリブレーションでネット調査をどうにかする実験

Ferri-Garcia, R., & Rueda, M.D.M. (2018) Efficacy of propensity score adjustment and calibration on the estimation from non-probabilistic online surveys. SORT, 42(2), 159-182.

非確率標本を傾向スコアで調整したりカリブレーションで調整したりするけどどうするのがいいのかシミュレーションで調べたよという論文。そりゃ傾向スコアでしょ、というか、共変量が良ければ勝つし、共変量に交互作用があるんなら周辺分布じゃなくて同時分布を調整したほうが勝つって話でしょ、と思ったけれど、「あとで読む」リストに入っていたので仕方なく読んだ。
 掲載誌はカタルーニャの学術誌だと思う。なぜ読もうと思ったのか思い出せないが、著者らはNonProbEstパッケージの中の人。あ、そうだ、Rueda, Ferri-Garcia, & Castro (2020)で引用されていたからリストにいれたんだった。忘れてた。
続きを読む

読了: Meng (2018) ビッグデータにおける統計的パラダイス、そしてパラドクス

Meng, X.L. (2018) Statistical paradises and paradoxes in big data (I): Law of large populations, big data paradox, and the 2016 US presidential election. The Annals of Applied Statistics, 12(2), 685-726.

 非確率標本の分析について調べていて、Meng による推定誤差の分解というのが出てきた。どこで出てきたんだっけ? えーと、Bailey(2022), Meng(2022)で出てきたようだ。他でも見かけたような気がする。
 よく理解できなかったので、referされている論文を読み始めたんだけど、偉い学者に特有の皮肉と諧謔に満ちた文章で、私にとっては死ぬほど読みにくく… 途中で疲れ切ってしまい、あえなく中断した。あーあ。
続きを読む

読了: Cornesse et al.(2020) 確率標本と非確率標本を比較した実証研究レビュー(非確率標本をいろいろ頑張って補正してもうまくいかないことが多いです)

Cornesse, C., Blom, A.G., Dutwin, D., Krosnick, J.A., de Leeuw, E., Legleye, S., Pasek, J., Pennay, D., Phillips, B., Sakshaug, J.W., Struminskaya, B., & Wenz, A. (2020) A Review of Conceptual Approaches and Empirical Evicdence on Probability and Nonprobability Sample Survey Research. Journal of Survey Statistics and Methodology, 8, 4-36.

 調べ物のついでに読んだ奴。謝辞によればドイツの大学のワークショップの産物で、第一著者はポスドクさん、あとはアルファベット順とのこと。よくわからんが、Krosnickさんが入っているので信用できそうだなと思った次第。
続きを読む

読了: Buelen, Burger, & van den Brakel (2018) 非確率標本で機械学習して母集団特性を当てますコンテスト

Buelens, B., Burger, J., & van den Brakel (2018) Comparing Inference Methods for Non-probability Samples. International Statistical Review, 86(2).

 仕事の都合で調べ物をしていて読んだ奴。非確率標本に基づいて母集団特性をモデルベース推測するのに機械学習を使い、手法間で成績を比較しました、という話。
続きを読む

読了: Little, West, Boonstra & Hu (2020) 標本選択が無視不能だったら標本にはこのくらいのバイアスがあるでしょうということを示す指標

Little, R.J.A., West, B.T., Boonstra, P.S., & Hu, J. (2020) Measures of the Degree of Departure from Ignorable Sample Selection. Journal of Survey Statistics and Methodology, 8(5), 932–964.

 非確率標本からの母集団特性推定についてあれこれ調べていて、たまたま見つけた論文。たいていの手法は、母集団の個体が標本に包含されないということを欠損と捉えたときにその欠損が調査変数にとってMARであることを想定してバイアスを取り除こうとするのだが(傾向スコアであろうがMRPであろうがそうです)、この論文は珍しく、MNARであることを前提にして、バイアスをどう取り除いたらいいのかわからんけれどどのくらいの大きさのバイアスがありそうかを推定します、という話である。
 なんだかややこしそうな話ではあるが、第一著者はLittle先生。話は難しいけれど書き方はわかりやすい先生だ、というぼんやりした信頼感がある。
続きを読む

読了: Chrostowski, Chlebicki, & Beresewicz (2025) 非確率調査データ分析のためのいまどきの手法を詰め込んだRパッケージnonprobsvy

Chrostowski, L., Chlebicki, P., & Beresewicz, M. (2025) nonprobsvy – An R Package for modern methods for non-probability surveys. arXIv.

 非確率標本に基づく母集団特性の推定のためのRパッケージとして、CRAN Task Viewの “Official Statistics & Survey Statistics“には、NonProbEstパッケージとnonprobsvyパッケージというのが載っている。前者についてはR Journalに記事があった。後者のvignetteにあたるらしきプレプリントを見つけたので読んでみた。こっちのほうが新しい機能を積んでいるようだ。
続きを読む

読了: Chen, Li, & Wu (2019) 非確率標本からの二重頑健推定

Chen, Y., Li, P., & Wu, C. (2019) Doubly Robust Inference With Nonprobability Survey Samples. Journal of the American Statistical Association.

相変わらず非確率標本からの母集団特性推定について調べているのだけれど、このたびは、先日読んだ Wu(2022)でフィーチャーされていた、Wuさんチームの論文を読んでみた。筆頭著者は博士課程の院生さん。
続きを読む

読了: Valliant (2020) 非確率標本で母集団特性を推定する手法のエキジビジョン・マッチ

Valliant, R. (2020) Comparing Alternatives for Estimation from Nonprobability Samples. Journal of Survey Statistics and Methodology, 8, 231-263.

 非確率標本に基づいて母集団特性を推測する手法をシミュレーションで比較しましたという論文。
続きを読む

読了: Rueda, Ferri-Garcia, & Castro (2020) 非確率標本のためのRパッケージNonProbEst

Rueda, M., Ferri-García, R., & Castro L. (2020) The R package NonProbEst for estimation in non-probability surveys. The R Journal, 12(1), 406-418.

 ここんとこ非確率標本に基づく推定の話を調べていて、含蓄の深い話が続いて心底くたびれた。リハビリのため、あまり深い話が出てこないであろう資料を手に取った。
 非確率標本のためのRパッケージNonProbEstの紹介記事。要はソフトの機能紹介で、後半はコード例である。癒されるねえ。
続きを読む

読了: Zhang (2019) 非確率標本に基づく記述的推論

Zhang, L.C. (2019) On valid descriptive inference from non-probability sample. Statistical Theory and Related Fields, 3(2), 103-113.

 都合により読んだ論文。なぜ読んだかというと、これの直前に読んだMeng(2022)がこれを読めと云っていたからである。嗚呼、素直な私。いずれ特殊詐欺とかに騙されるんじゃなかろうか。
続きを読む

読了: Wu (2022) 非確率標本による統計的推論 (質疑応答編 パートII)

Meng, X.L. (2022). Comments on “Statistical inference with non-probability survey samples” – Miniaturizing data defect correlation: A versatile strategy for handling non-probability samples. Survey Methodology, 48(2), 339-360.

非確率標本の分析についてのレビュー論文 Wu(2002) に寄せられた5人の識者によるコメントと著者の返答のうち、4人までは読んだんだけど、残る一人分はコメントとは思えない大論文になっている。こうなったら意地で読むしかない。
続きを読む

読了: Wu (2022) 非確率標本による統計的推論 (質疑応答編 パートI)

Bailey, M.A. (2022) Comments on “Statistical inference with non-probability survey samples” – Non-probability samples: An assessment and way forward. Survey Methodology, 48(2), 313-318.
Elliott, M.R. (2022) Comments on “Statistical inference with non-probability survey samples”. Survey Methodology, 48(2), 319-329.
Lohr, S.L. (2022). Comments on “Statistical inference with non-probability survey samples”. Survey Methodology, 48(2), 331-338.
Wang, Z. & Kim, J.K. (2022) Comments on “Statistical inference with non-probability survey samples”. Survey Methodology, 48(2), 361-366.

 カナダ統計局のSurvey Methodology誌に載った、非確率標本の分析についてのレビュー論文 Wu(2002) には、5人の識者によるコメントと著者の返答が付いている。以下はそのうち4人についてのメモ。残るMengさんのコメントは、20頁近い大論文になってしまっているので、別のエントリで。

 読み返してみるとなんだか喧嘩しているように見えて面白い。論文へのコメンタリーというものはかなりの行数を使って元論文の良いところを挙げるものだが、そういうのは全部端折ってメモしているので、そうみえるのである。いいぞ、もっとやれ。
続きを読む

読了: Wu (2022) 非確率標本による統計的推論 (レビュー編)

Wu, C. (2022) Statistical Inference with Non-probability survey samples. Survey Methodology, 48(2), 283-311.

 仕事の都合で読んだ奴。非確率標本からの母集団特性推定についての研究レビュー。掲載誌はカナダ統計局の発行。
 本文は35ページ、その後5人の論者による質疑応答がついて、全部で100ページ近い。いや、読みますよ、読みますけどね、いろいろ辛いなあ。
続きを読む

読了: Sigmund & Ferstl (2019) パネルVARモデルのRパッケージpanelvar、その全内幕

Sigmund, M., & Ferstl, R. (2019) Panel vector autoregression in R with the package panelvar. The Quarterly Review of Economic and Finance.

パネルVAR(ベクトル自己回帰)モデルのためのRパッケージpanelvarの解説。先日、仕事で使おうかなと思う用事があったので、試しにめくった次第。もちろん細かいところは全然理解できていない。
続きを読む

読了: Rodriguez-Rondon & Dufour (2024) MSTestパッケージをインストールしなさい。マルコフ・スイッチング・モデルのレジーム数についての本当の検定というものをお見せしますよ

 このたび仕事で時系列のレジーム・スイッチング・モデルの話に取り組んでいたんだけど、困ったのが、ある時系列についてわざわざレジーム・スイッチを考える必要があるのかないのか、どうやって判断すんの? という問題であった。(あまりに初歩的な疑問で、なんだか恥をさらしているような気がする…)

 きっとなにかしら検定のような方法があるはずだ。でも、直観的には、単にレジーム数1のモデルと2のモデルのあいだで尤度比検定してはいけないような気がする。しかし、なぜそう思うのか自分でもうまく説明できない。
 RにはMSTestというパッケージがあって、レジーム数についての検定をご提供します、って書いてある。お、これじゃん。ところが、出力の見方がさっぱりわからない。思い余ってChatGPTくんに尋ねてみると、いいえ、RのMSTestパッケージとはマルチ・ステージ検定のパッケージです、マルコフ・スイッチング・モデルのレジーム数については、2つのモデルの間での尤度比検定が可能ですと断言し、Rのコードと出力例を示してくる。しかし、どうみてもシンプル過ぎるコードと雑な出力で、疲れている私の目から見ても疑わしい。ひとこと「ほんとですか?」と問い返すと、しばらく考えたのちに「申し訳ありません、検定はMSTestパッケージによって可能です」と反省のそぶりを見せるが、今度はありもしない関数の使い方を説明してくる。
 キレるよ? 夜中にブチギレちゃうよ???
続きを読む

読了: Visser & Speekenbrink (2010) RのdepmixS4パッケージへの招待

Visser, I., & Speekenbrink, M. (2010). depmixS4: An R Package for Hidden Markov Models. Journal of Statistical Software, 36(7), 1–21.

 RパッケージdepmixS4のvignette。上記はJSSの論文だが、実際にはパッケージ添付のvignetteを読んだ。
 実戦投入検討前のセレモニーとして大急ぎでめくった奴なので、ほとんどの部分をちゃんと読んでいない。
続きを読む

読了: Torkamani & Lohweg (2017) 時系列モチーフ発見入門

Torkamani, S., & Lohweg, V. (2017) Survey on time series motif discovery. WIRES Data Mining and Knowledge Discovery, 7(2).

 仕事の都合で読んだ奴。時系列モチーフ発見についての短い解説。この分野について全然知らんので、まずは易しそうなやつから目を通した。でも、数式が全く出てこないというのも、それはそれで怖いなあ…
続きを読む

読了: Schwarzkopf (2016) 市場調査の歴史:1890-1960

Schwarzkopf, S. (2016). In Search of the Consumer: The History of Market Research from 1890 to 1960. In B. Jones, & M. Tadajewski (Eds.), “The Routledge Companion to Marketing History“.

 仕事の都合で読んだ奴。
 市場調査の歴史についての解説。入手方法を模索していたのだが、google booksでたまたま全部読めることに気が付いた。
 いま調べていることと関係があるのでありがたいし、それを離れても面白いっちゃ面白い。しかし、途中で(俺はいったいなにを読んでいるんだ…)という気もしてきた。気持ちが萎えそうになったので、メモが少々細かめになっています。
続きを読む

覚え書き: Pearl先生、「強い無視可能性」概念を全力でディスるの巻

 いま流行りの因果推論の分野における一方の巨匠Pearl先生は、同時にかなり攻撃的な物言いでも知られている方である。もしかすると同業の先生方は困っちゃっているのかもしれないし、パレスチナ問題に関するツィートは私もちょっと引いちゃいましたが(私はもうXにアクセスしてないので最近の動向はわからない)、専門家がご専門の話題について旗幟を鮮明にし論点を明示してくださるのは、初学者としては助かる面もありますね。それに、ほら、人の悪口ってちょっと楽しかったりしませんか。しますよね。

 Pearl先生の主著”Causality”は第1版が邦訳されているが、難解さで知られており、私は何度もトライしては挫折している。いっぽう、第2版(2009)には第1版から追加された章があり、その一部はwebで公開されており、それらはなかなか楽しい内容が多い。11.5.3節の架空対話は以前ほとんど全訳してしまった。
 このたび調べ物をしていて、因果推論の重要概念として人口に膾炙している「強い無視可能性」概念を批判しその提唱者らをディスっている文章を見つけてしまい、お茶を啜りつつフガフガと楽しく読んだ(すいません)。勢いあまってメモを取ったので載せておく。
続きを読む