論文」カテゴリーアーカイブ

読了: Yoshida, Tsukatsune, Niida (2020) webページが表示されないことのメンタルモデル

Yoshida, H., Tsukatsune, K., Niida, S. (2020) Analysis of mental model of users with network mulfunction. Human Interface and the Management of Information. Designing Information (HCII 2020).

 仕事の都合で読んだやつ。
 個別のデバイスについてのユーザのメンタルモデルを調べる研究はたくさんあると思うけれど、インターネットのような大きなシステムについてのメンタルモデルを調べたのはないかなあと思い、たまたま見つけて目を通した。情報コミュニケーション技術(ICT)の動作不全に対するユーザのメンタルモデルを調べますという話。KDDI研究所におられた方々による発表らしい。
続きを読む

読了: Sugasawa & Kubokawa (2020) 混合モデルによる小地域推定のレビュー

Sugasawa, S., Kubokawa, T. (2020) Small area estimation with mixed models: a review. Japanese Journal of Statistics and Data Science. 3, 693–720.

 勉強のためにめくったやつ。小地域推定という地味な分野にも、なんか新しい展開とかあるんじゃないかなと思って。
 小地域推定のうち混合モデルを使う手法についてのレビュー論文(小地域推定の多くの議論は混合モデルに基づくので、ほぼ小地域推定レビューといえよう)。第二著者は「現代数理統計学の基礎」の著者の先生であろう。
 2章が基礎、3章が分散推定の話。4章が本題である。
続きを読む

読了: Smith, Pettigrew, Pippin, & Bialosiewicz (2012) 相対的剥奪研究レビュー

Smith, H.J., Pettigrew, T.F., Pippin, G.M., Bialosiewicz, S. (2012) Relative Deprivation : A Theoretical and Meta-Analytic Review. Personality and Social Psychology Review, 16(3), 203-232.

 街を歩くと憂鬱になる。あちこちに目につくオレンジ色の選挙ポスター。ついに日本にも極右ポピュリズムの高波が押し寄せてきた。欧州諸国のニュースをみるに、いつかはそのときが来ると頭ではわかっていたのだが、世情の変化は想像を超えて速い。これから見たくないものをたくさん見なければならないだろう、という絶望感がある。
 あの人たちの主張に対してはどうかしているとしかいいようがないし、オレンジ色の政党そのものはいずれ別の何かに代わるかもしれないけれど、その背後にある人々の「大事なものを奪われた」という感覚は、これからの社会を突き動かし、毒し続けるだろうと思う。私にできることはあまりないけれど、せめてこれから起きることを少しでも理解したいものだ、とあれこれ思いあぐね、相対的剥奪に関するレビュー論文に目を通した。心理学のリジッドな実証研究に目の前の生々しい現象についての示唆を期待するのは、ちょっと筋違いかなという気もするんだけど。
続きを読む

読了: Godambe & Thompson (1986) 推定関数理論からみた超母集団パラメータと調査母集団パラメータ

Godambe, V.P., Thompson, M.E. (1986) Parameters of Superpopulation and Survey Population: Their Relationships and Estimation. International Statistical Review, 54(2), 127-138.

 有限母集団特性の推定の話を読んでいるとときどき出てくる、推定関数・推定方程式という考え方がどうにも理解しにくく、悔しい思いをしている。腹立ちまぎれに、標本抽出論の解説書Arnab (2017) の該当章を読んでみたんだけど、やはりよくわからない。よし、原典に戻ってみよう! 逐語訳に近いレベルでメモを取れば俺にだって少しはわかるだろう! と思って、Godambeさんの論文を読んでみた。無謀だなあ。
 短い論文だが、たぶん当該領域の重要文献だと思う。google様曰く被引用回数238。
続きを読む

読了: Yang, Kim, & Song (2020) 非確率標本に基づく二重頑健推定の際の共変量選択法

Yang, S., Kim, J.K., Song, R. (2020) Doubly robust inference when combining probability and non-probability samples with high dimensional data. Journal of the Royal Statistical Society Series B: Statistical Methodology, 82(2), 445–465.
 
 非確率標本と確率標本があるとき、前者をうまいことウェイティングしましょうとか、前者でモデルを組んで後者にあてはめて母集団特性を予測しましょうといった方法があるけれど、最近ではその延長線上に、両方やって二重頑健推定しましょうという話もある。ひゅー、かっこいい、今流行りの因果推論みたいだ。私も市場調査みたいな地味な仕事じゃなくて、web広告の最適化とかでぶいぶいいわせられるかもしれない。よーし転職してタワマンの上の方に住んで港区女子と不倫するぞ! (←貧困なイメージ)
 まあとにかくそういうとき、かつ、共変量がたくさんありすぎて困っちゃうとき(どんどんSFっぽくなっていくね)、罰則付き回帰で変数選択するぞ、という論文。
続きを読む

読了: Arnab (2017) 推定関数とはなにか

Arnab, R. (2017) Estimating Function. in “Survey Sampling Theory and Applications“, Chapter 22. Academic Press.

 有限母集団推定の話を読んでいると、ときどきGodambeの推定方程式アプローチというのが出てきて、話のポイントが全然つかめず困惑することがある。いらいらしてきたので教科書的な説明を探して読んでみた。著者とこの書籍についてはまったく初見だが、標本抽出についての難しめの教科書である模様。
 全部で23ページあるが、読むのは前半の14ページ。
続きを読む

覚え書き: James-Stein推定量の全MSEは標本平均のそれよりも小さい

 多変量正規分布の母平均ベクトルのJames-Stein推定量は、誤差二乗和の観点から見て標本平均に優越している。これはあっちこっちに書いてある有名な話だが、証明をいくら読んでもピンとこなかった。
 このたび業を煮やし、真剣に考えた。
続きを読む

読了: Samworth (2020) Steinのパラドックス

Samworth, R.J. (2020) Stein’s paradox. Eureka, 66.

 スタインのパラドクスについての短い解説。掲載誌はthe Mathematical Society of Cambridge Universityの発行で、学会誌というより親睦団体の会報みたいなのだと思う。
 パラドクスの証明(母平均ベクトルのJames-Stein推定量の誤差の二乗和の期待値が標本平均のそれより小さいという証明)が別の補題とかを使わずに半頁で示されていて、こんなにコンパクトに証明できるのか! と感心したんだけど、読んでみたら、全然むずかしいよ、これ。多変量正規分布を積分するんだけど、途中でしれっと変形しているところがからきしわからない。ChatGPTくんにPDFを渡し、延々問い詰めてようやく理解できたけど、著者はわからせようと思ってないんじゃなかろうか。頭のいい奴らってほんとに信用できない!

読了: 松田(2021) 縮小推定と優調和性

松田孟留(2021) 縮小推定と優調和性. 応用数理, 31(4), 7-14.

 題名の通り、縮小推定についての解説。母平均ベクトルのベイズ推定量は事前分布がどんなんだと許容的になるかとか(優調和性という性質があるといいんだってさ)、行列の縮小推定とか。正直、内容の8割は理解できなかったが、これは私が背伸びしすぎだからである。
 参考書としてSpringerから出ているFourdrineir, Strawderman, & Wells(2018) “Shrinkage Estimation”というのが挙げられていた。たまたま原著を手に取る機会があったのでめくってみたら、少なくとも最初のほうはなんとか読めそうな感じであった。あれで勉強すればいいのかな。

読了: Schonlau & Couper (2017) Web調査虎の巻 in 2017

Schonlau, M., Couper, M.P. (2017) Options for Conducting Web Surveys. Statistical Science. 32(2), 279-292.

 非確率標本の傾向スコア調整の文脈でときどき引用される論文。ついでに目を通しておこうという主旨で手に取ったのだが、正直、この話題にちょっと飽きかけている。
 著者らの名前からもわかるように、この論文は統計学というより調査方法論の論文で、数式はほとんど出てこない。
 → いま気が付いたけど、この雑誌のこの号はComplex Surveys特集号。というか、私はこの特集号の存在にとっくに気づいていて、イントロと収録論文2本にすでに目を通しているではないか。笊で水を汲んでいるようなものだな…
続きを読む

読了: Marra & Radice (2017) 未観察の交絡がある? 非確率標本? ふたつの二値アウトカムの両方が1かそうでないかしか測定してない? よろしい、RのGJRMパッケージで二変量二値回帰モデルを組みなさい

Marra, G. & Radice, R. (2017). A joint regression modeling framework for analyzing bivariate binary data in R. Dependence Modeling, 5(1), 268-294.

 先日から非確率標本で母集団を推定するという話についてあれこれ調べているんだけど、たいていの話は共変量の下での標本選択と目的変数の独立性、つまり欠損データ分析でいうところのMARを前提としていて、MNARモデルの話はなかなか出てこない。でも、そういうのもありそうじゃんね? 考えてみたらHeckmanモデルとかそうじゃんね?
 などと思いながらRパッケージを眺めていたら、GJRMパッケージというのが怪しげである。というわけで、実戦投入の予定はないが、vignetteに相当するであろう論文を読んでみた。掲載誌はみたこともない謎の雑誌だが、版元はDe Gruyterなので、そんなに変な雑誌ではないだろう。
続きを読む

読了: 星野・前田 (2006) ネット調査を傾向スコアで調整する in 2006

星野崇宏・前田忠彦(2006) 傾向スコアを用いた補正法の有意抽出による標本調査への応用と共変量の選択法の提案. 統計数理, 54(1), 191-206.

 非確率調査の傾向スコア補正について日本語で書かれた代表的な論文。すでに読んでいたが、このたび都合により読み直した。
 このたび同趣旨の論文をあれこれ読んでいるのだが、2006年というのは初期に属すると思う。この年、私なにしてたっけ… あれこれあって路頭に迷った末、新聞広告でみた市場調査会社様に拾っていただいたら、これがイケイケの伸び盛りの会社で、思いのほか忙しくて後悔していた時期、かな…
続きを読む

読了: Cobo, Ferri-Garcia, Rueda-Sanchez, & Rueda (2024) 非確率標本のためのR/Pythonパッケージ

Cobo, B, Ferri-Garcia, R., Rueda-Sanchez, J.L,, Rueda, M.D.M. (2024) Software review for inference with non-probability surveys. The Survey Statistician, 90, 40-47.

 非確率調査のためのR/Pythonパッケージの紹介記事。あ、著者らはNonProbEstパッケージの中の人ではなかろうか。掲載誌についてはよくわからないが、学会の会報みたいな感じだ。
 RのNonProbEstパッケージ, nonprobsvyパッケージ、nppRパッケージ (CARTによる傾向スコアモデル、二重頑健推定量を提供)、KWMLパッケージ(機械学習によるウェイティングを提供)、Pythonのinpsパッケージが紹介されている。

読了: Valliant & Dever (2011) 任意参加型Web調査を傾向スコア調整する

Valliant, R., Dever, J.A. (2011) Estimating Propensity Adjustments for Volunteer Web Surveys. Sociological Methods & Research, 40(1), 105-137.

 非確率標本の傾向スコア調整に関する研究で頻繁に引用されている論文。私が読んだ範囲でも、えーと、Mercer, et al.(2017), Chen, Li, & Wu (2020), Rueda, Ferri-Garcia, & Castro (2020), Wu(2022), Elliott(2022)に出てきた。
 実のところ、この論文の提案はWu(2022)で結構きつめに批判されていて、たしかに変だよなという感じだったのだが、でもプロの研究者がそういう方法を提案したからにはなにがしか理由があったんじゃないのかな、とも思ったのであった。というわけで、原文に当たってみた次第。
続きを読む

読了: Datta & Ghosh (2012) 小地域縮小推定レビュー

Datta, G., & Ghosh (2012) Small Area Shrinkage Estimation. Statistical Science, 27(1), 95-114.

 仕事の都合でMrPモデルを推定していて思ったんだけど、地域の母平均推定量は地域の標本サイズが小さいときにふつう全体の母平均推定値に向かってシュリンクしていく。これはMrP(つまり階層回帰モデル)の性質というより、小地域推定に用いられるいろんな方法に共通した性質だし(地域レベルの単純な方法、たとえばFay-HerriotモデルやJames-Stein推定量もそうだ)、他のいろんな推定でもそういうことが起きる(回帰の正則化とか)。
 小地域推定のいろんな手法を、縮小特性という角度からレビューしたものはないだろうか? と思って探してみたら、そのものずばりの論文があった。きっと私の能力を超える論文だろうなとは思ったが、試しに読んでみた。仕事を離れた勉強のつもりなので、いきなりメモを取りながら読みはじめ、嫌になったら挫折する気満々、という作戦である。
 掲載誌のこの号は”Minimax Shrinkage Estimation: A Tribute to Charles Stein”という特集号だったようだ。WikipediaによればSteinの死去は2016年。
続きを読む

読了: Elliot(2009) 確率標本と非確率標本の結合データに疑似ウェイトを振る

Elliot, M.R. (2009) Combining Data from Probability and Non- Probability Samples Using Pseudo-Weights. Survey Practice, 2(6).

 たった7pの短い論文。この掲載誌っていったいなんだろう? オンラインジャーナルらしいけれど。まあとにかく、ときどき引用されているので読んでみた。
 傾向スコアという言葉は使っていないが傾向スコア調整の話である。google様曰く被引用回数93。
続きを読む

読了: Ferri-Garcia & Rueda (2018) 傾向スコア調整とカリブレーションでネット調査をどうにかする実験

Ferri-Garcia, R., & Rueda, M.D.M. (2018) Efficacy of propensity score adjustment and calibration on the estimation from non-probabilistic online surveys. SORT, 42(2), 159-182.

非確率標本を傾向スコアで調整したりカリブレーションで調整したりするけどどうするのがいいのかシミュレーションで調べたよという論文。そりゃ傾向スコアでしょ、というか、共変量が良ければ勝つし、共変量に交互作用があるんなら周辺分布じゃなくて同時分布を調整したほうが勝つって話でしょ、と思ったけれど、「あとで読む」リストに入っていたので仕方なく読んだ。
 掲載誌はカタルーニャの学術誌だと思う。なぜ読もうと思ったのか思い出せないが、著者らはNonProbEstパッケージの中の人。あ、そうだ、Rueda, Ferri-Garcia, & Castro (2020)で引用されていたからリストにいれたんだった。忘れてた。
続きを読む

読了: Meng (2018) ビッグデータにおける統計的パラダイス、そしてパラドクス

Meng, X.L. (2018) Statistical paradises and paradoxes in big data (I): Law of large populations, big data paradox, and the 2016 US presidential election. The Annals of Applied Statistics, 12(2), 685-726.

 非確率標本の分析について調べていて、Meng による推定誤差の分解というのが出てきた。どこで出てきたんだっけ? えーと、Bailey(2022), Meng(2022)で出てきたようだ。他でも見かけたような気がする。
 よく理解できなかったので、referされている論文を読み始めたんだけど、偉い学者に特有の皮肉と諧謔に満ちた文章で、私にとっては死ぬほど読みにくく… 途中で疲れ切ってしまい、あえなく中断した。あーあ。
続きを読む

読了: Cornesse et al.(2020) 確率標本と非確率標本を比較した実証研究レビュー(非確率標本をいろいろ頑張って補正してもうまくいかないことが多いです)

Cornesse, C., Blom, A.G., Dutwin, D., Krosnick, J.A., de Leeuw, E., Legleye, S., Pasek, J., Pennay, D., Phillips, B., Sakshaug, J.W., Struminskaya, B., & Wenz, A. (2020) A Review of Conceptual Approaches and Empirical Evicdence on Probability and Nonprobability Sample Survey Research. Journal of Survey Statistics and Methodology, 8, 4-36.

 調べ物のついでに読んだ奴。謝辞によればドイツの大学のワークショップの産物で、第一著者はポスドクさん、あとはアルファベット順とのこと。よくわからんが、Krosnickさんが入っているので信用できそうだなと思った次第。
続きを読む

読了: Buelen, Burger, & van den Brakel (2018) 非確率標本で機械学習して母集団特性を当てますコンテスト

Buelens, B., Burger, J., & van den Brakel (2018) Comparing Inference Methods for Non-probability Samples. International Statistical Review, 86(2).

 仕事の都合で調べ物をしていて読んだ奴。非確率標本に基づいて母集団特性をモデルベース推測するのに機械学習を使い、手法間で成績を比較しました、という話。
続きを読む