読んだものはなんでも記録しておこう、ということで…
柳本武美(1995) 推定方程式に基づく推定: 最尤法とモーメント法から. 応用統計学, 24(1), 1-12.
別の論文に挑戦しようとして(メモしておくとGodambe & Thompson(1986)、有限母集団特性のモデルベース推定の話)、到底歯が立たず、せめてもの手がかりにならないかと思ってめくった。
正直、これも難しくてよくわからんかった… 悲しい…
続きを読む
読んだものはなんでも記録しておこう、ということで…
柳本武美(1995) 推定方程式に基づく推定: 最尤法とモーメント法から. 応用統計学, 24(1), 1-12.
別の論文に挑戦しようとして(メモしておくとGodambe & Thompson(1986)、有限母集団特性のモデルベース推定の話)、到底歯が立たず、せめてもの手がかりにならないかと思ってめくった。
正直、これも難しくてよくわからんかった… 悲しい…
続きを読む
Dorfman, A.H., Valliant, R. (1997) The Hajek Estimator Revisited. Proceedings of the Section on Survey Methods Research, American Statistical Association.
標本ウェイティングについて調べ物をしていると、googleの検索結果にはいつもこれが上位に挙がってくる。内容は難しそうだし、そもそも論文ではないし、毎回「これはちがうだろう」と避けていたのだが、あまりによく見かけるので、これもなにかの勉強だろうと思い、メモをとりながら読んでみた。正直、かなり早い段階で後悔しはじめたのだが…
続きを読む
標本抽出について調べていると、値を抽出確率の逆数で重みづけて合計して母集団サイズで割ると(Horvitz-Thompson推定量)、それは母平均の不偏推定値だよ、いっぽう母集団サイズじゃなくて重みの和で割ると(Hajek統計量)、それは不偏じゃない、でも一致推定量だよ、なんていう話が出てくる。で、不偏性の証明は出てくるけど、一致性の証明は出てこない。おまえらユーザには理解できんだろうから省略するよ、というニュアンスがひしひしと伝わってくる。なんだかイライラする。いま文化大革命とか起きたら、私は紅衛兵となってキャンパスに突入し統計家を群衆のもとに引き出して自己批判を迫るかもしれない。(すいません冗談です)
まあご配慮は正しいんだけどさ。推定量の漸近的挙動なんて途方に暮れるじゃないですか。聞かされても絶対理解できるわけないじゃないですか。でもちょっと覗き見したいんですよね。背伸びして大人の世界に触れてみたい、というか。(いいおっさんが… 我ながらキモイ)
Delovoye, A., Savje, F. (2020) Consistency of the Horvitz-Thompson estimator under general sampling and experimental design. Journal of Statistical Planning and Inference, 207, 190-197.
そんなこんなで、本文が短いので読んでみた。HT推定量の一致性の一般的条件を示すのだそうです。Google様いわく、被引用件数11件。
さあ、怖いものみたさでゴー!
続きを読む
Tille, Y., Wilhelm, M. (2017) Probability Sampling Designs: Princeples for Choice of Design and Balancing. Statistical Science, 32(2), 176-189
Statistical Science誌の2017年の調査特集号に掲載された論文を全部読んじゃおうプロジェクト、その第4弾。この論文は標本抽出デザインの選択という話で、いまの私の関心からちょっと外れているので、メモは粗めである。
続きを読む
仕事の都合で、調査データのウェイティングという複雑怪奇な問題について考える羽目になることがあるのだけれど、なにか役にたつ資料はないものかと探していると、Statistical Scienceの2017年の調査特集号に突き当たることが多い。去年目を通した Elliot & Valliant(2017)、先日読んだBreidt & Opsomer(2017)もこの号に掲載された論文だった。
四の五の言わず、この号に載った9本の論文(残り7本)に片っ端から目を通しちゃえばいいのではないか、と思って、とりあえず(おそらくは編者によるのであろう)イントロをパラパラめくり始めたら、これが意外に面白く、かつ難しく… 結局、最初からメモを取りながら読み直すことになった。
Skinner, C., Wakefield, J. (2017) Introduction to the Design and Analysis of Complex Survey Data. Statistical Science, 32(2), 165-175.
続きを読む
Breidt, F.J., Opsomer, J.D. (2017) Model-assisted survey estimation with modern prediction techniques. Statistical Science, 32(2), 190-205.
のメモ、最終回。いよいよ面白い話になってくる。GREG推定でいうところの「作業モデル」を機械学習で組んじゃうのだ。
続きを読む
前回に引き続き、
Breidt, F.J., Opsomer, J.D. (2017) Model-assisted survey estimation with modern prediction techniques. Statistical Science, 32(2), 190-205.
のメモ、その第二回。いよいよ、著者の云うところのモデル・アシステッド推定とはなんなのかが明らかになる。話の先取りになるけど、要するにGREG推定量のことなのだ。ナアンダというなかれ、俺はこういう風に考えたことなかったよ。
続きを読む
Breidt, F.J., Opsomer, J.D. (2017) Model-assisted survey estimation with modern prediction techniques. Statistical Science, 32(2), 190-205.
標本ウェイトつき調査データの分析方法について調べていて(ときどき仕事の都合でそういうニーズに突き動かされる)、たまたまめくった奴なんだけど、意外や意外、とても面白くて、最後まで目を通すことなく、途中で冒頭に戻ってメモを取り始めた。しかも講演口調で。
実はいまもって読み終えてないんだけど(記事題名に読了とあるのは現時点で偽りである)、これ、もっと早く読んでおけばよかった… そうすれば先日のToth & Eltinge (2011)ももう少しは理解できていたかもしれない。
長くなりそうなので数回に分ける。まずは全9章のうち1-3章のメモ。
続きを読む
Toth, D., Eltinge, J. (2011) Building consistent regression trees from complex sample data. Journal of the American Statistical Association, 106(409), 1626-1636.
仕事の都合で標本ウェイトつきのデータを使って分類木モデルをつくりたくなり、あれこれ調べていて見つけた論文。
少なくともタイトルは知りたいことにぴったりだし、第一著者はサーベイデータに特化した分割木・森モデリングのRパッケージrpmsの中の人だし、これを読めば道が開けるかな、と思ったのが運の尽き… いやあ、えらい目にあった。
続きを読む
Yao, W., Li, Z., Graubard, B.I. (2014) Estimation of ROC curve with complex survey data. Statistics in Medicine, 34(8), 1293-1303.
仕事の都合で読んだやつ。複雑な標本抽出デザインのデータからROC下面積(AUC)とその分散を推定するにはどうしたらいいか、という論文である。
うーん、マニアックな話だなあ。夢もへったくれもないなあ。俺もChatGPTのマーケティング活用だとかそういうの語りたいのに。なんかこう、カメラの前でろくろとか回したいのに…
続きを読む
代表性のない標本調査に基づいて母集団特性をうまいこと推測する、という話題のひとつに、Mr.P ことMRP(マルチレベル層化・回帰)というのがある。選挙予測で注目を集めた手法で(たしかYouGovがジョンソン勝利を当てたときに使ったんですよね)、私は面白がってGelman先生たちのarXivの論文のメモをとったりしてたんだけど、国内でもあれよあれよという間に有名になり、周囲から「MRPって知ってます?」と訊かれ、学会発表やそのへんの調査結果リリースでも見かけるようになり、なんと日本の伝統的大手メディアの方まで採用を検討しはじめ、ついには「MRPってできますか」と問い合わせが来たりするようになった。さすがにここまで来ると、個人的な熱は冷めてしまう。
このたびちょっと思い立って検索してみたら、もはや心理学などの隣接諸分野で啓蒙論文が出るレベルにまで普及したようだ。2020年以降の論文は件数が少なく、とっくにハイプ・カーブの峠を越えたという感じである。
そのなかから試しに一本読んでみた。疫学分野での手法検証研究である。
続きを読む
ここしばらく、時系列モデリングの解説書を頼りに、INLA(積分段階的ラプラス近似)の理屈を理解しようと試みていた。目当ての2章は読み終えたので、この本はこれでおしまいにするつもりにするつもりだったのだが、なんとなく3章も目を通してしまった。
Wang, X., Yue, Y.R., Faraway, J. (2023) Dynamic Time Series Models using R-INLA: An Applied Perspective. Chapter 3. Details of R-INLA for Time Series.
せっかくなので、各節のごくごく概要についてメモしておく。ちなみに本章は長いのだが、チャートが多く、実質的な内容はみかけほど多くない。
続きを読む
前回に引き続き、時系列モデルについてのINLA(積分段階的ラプラス近似)の解説書。全14章だが、第1,2章だけはメモしながら読むことにした。いよいよ第2章。
Wang, X., Yue, Y.R., Faraway, J. (2023) Dynamic Time Series Models using R-INLA: An Applied Perspective. Chapter 2. A Review of INLA.
続きを読む
Wang, X., Yue, Y.R., Faraway, J. (2023) Dynamic Time Series Models using R-INLA: An Applied Perspective. Chapter 1. Bayesian Analysis.
長く個人的懸案のひとつであったINLA(積分段階的ラプラス近似)について学ぶべく、このたびRue, Martino, Chopin(2019)にチャレンジし、学力不足により涙を飲んで撤退した次第だが、いきなり原典における一般的記述を読もうとしたのがいかんかったよな、というのが反省点であった。気を取り直し、今度は領域を絞った解説書をあたってみた。
R-INLAについての解説本のうち、特に時系列モデルについての本。本の評判については知らないが、なんだかわかりやすそうだし、きちんとした感じだし、なにより全文が公開されている。ありがたい。
続きを読む
Lakens, D., Scheel, A.M., Isager, P.M. (2018) Equivalence Testing for Psychological Research: A Tutorial. Advances in Methods and Practices in Psychological Science. 1(2), 259-269.
仕事の都合でごくたまに等価性検定の話が出てくることがある。消費財のマーケティングリサーチでは、たとえば原材料や製法をコスト削減しても製品知覚は変わんないことを確認したい、というような場面が典型的である。今回もちょっと似たような用事があって、話のついでにめくってみた。ときどき読まないと忘れてしまう。
等価性検定や非劣性検定の話をマジメに勉強するならば、それはもう医学統計の教科書をあたるべきなんだけど、今回は心理学者向けの易しい啓蒙論文。週末の気分転換だからね、と自分に言い訳して…
続きを読む
前回に引き続き、以下の論文のメモ。
Rue, H., Martino, s., Chopin, N. (2009) Approximate Bayesian Inference for Latent Gaussian Models by Using Integrated Nested Laplace Approximations. Journal of Royal Statistical Society, B. 71(2), 319-392.
どうやら私の能力を超えている… 辛い…
続きを読む
万可, 谷岡健資, 南弘征, 下川敏雄, 水田正弘 (2020) 治療効果が顕著なサブグループを抽出するための境界内平均生存時間に基づく生存時間Bump Hunting法の開発. 計算統計学, 33(1), 1-28.
仕事の都合でめくった奴。
どういう話かというと、観察データなり臨床試験のデータなりから、新治療と既存治療のアウトカムの差が特に大きいサブグループを抽出したいという話である。大変失礼ながら提案手法そのものには関心がなくて、この領域にはどういう手法があるのかな、という関心から斜め読みした次第。すいません、ちゃんと読んでないです…
続きを読む
流れ流れてデータ解析とかで生計を立てていますが、一日に三回くらい、なぜ私はこんなことをしているのか… もっとましな人生があったのではないか… という疑念に囚われる。もっとましな人生ってなに? よくわかんないけど。
さらに、Stanのコンパイルでイライラするたび、なぜ私はこんな面倒なことをしているのか… これはMCMCじゃなくてなにか別の方法でも解けるのではないか… という疑念に囚われる。別の方法ってなに? 知らんけど。INLAとか?
そんなこんなで、数年前から何度かINLAを実戦投入しようとし、その度に挫折している。検索すると2017年、R-INLAについての解説を読んでいるようだが、メモを読み返すと内容をあまり理解できていないことが丸分かりである。切ないのう。
Rue, H., Martino, s., Chopin, N. (2009) Approximate Bayesian Inference for Latent Gaussian Models by Using Integrated Nested Laplace Approximations. Journal of Royal Statistical Society, B. 71(2), 319-392.
そういうわけで、先日も仕事の都合で発作的にINLAの勉強をはじめた(仕事のほうは時間切れでそれどころではなくなり、結局はStanで切り抜けた)。その際のメモ。長くなるので2パートくらいにわける。
続きを読む
Tierney, L, Kadane, J.B. (1986) Accurate Approximations for Posterior Moments and Marginal Densities. Journal of the American Statistical Association, 82(393), 82-86.
都合により調べ物をしていて(後日のためにメモしておくとRue, Martino, & Chopin(2009), INLAについての論文)、途中で話についていけなくなったので、引用を遡って読んでみた奴。
こんなの読むなんて柄じゃないんですけどね。数学できないんですけどね。いったいどういう罰ゲームなのか。
続きを読む
合崎英男(2015) Rパッケージsupport.CEsとsurvivalを利用した離散選択実験の実施手順. 北海道大学農經論叢, 70, 1-16.
離散型コンジョイント分析のRパッケージSupport.CEsの作者ご自身による解説。このたび離散型コンジョイント分析の実験計画についてのメモを作っていて、その都合で目を通した。
Aizaki(2012 JSS), Aizaki, Nakatani, Sato(2014 書籍)の日本語解説版とのこと。ほんとは本を読むべきなんだけど。
続きを読む