Yang, S., Kim, J.K., Song, R. (2020) Doubly robust inference when combining probability and non-probability samples with high dimensional data. Journal of the Royal Statistical Society Series B: Statistical Methodology, 82(2), 445–465.
非確率標本と確率標本があるとき、前者をうまいことウェイティングしましょうとか、前者でモデルを組んで後者にあてはめて母集団特性を予測しましょうといった方法があるけれど、最近ではその延長線上に、両方やって二重頑健推定しましょうという話もある。ひゅー、かっこいい、今流行りの因果推論みたいだ。私も市場調査みたいな地味な仕事じゃなくて、web広告の最適化とかでぶいぶいいわせられるかもしれない。よーし転職してタワマンの上の方に住んで港区女子と不倫するぞ! (←貧困なイメージ)
まあとにかくそういうとき、かつ、共変量がたくさんありすぎて困っちゃうとき(どんどんSFっぽくなっていくね)、罰則付き回帰で変数選択するぞ、という論文。
続きを読む