1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

mice の流れ:mice - with - pool

多重補完法(MICE:Multiple Imputation by Chained Equations)は、モデルベースの補完を用いてデータセットを複数回補完しながら条件付き分布からサンプリングすることで、補完に伴う不確実性を推定する手法です。この方法では、補完されたデータセットがそれぞれ少しずつ異なります。各データセットに対して分析を行い、その結果をプールすることで、補完の不確実性を反映した信頼区間とともに目的の統計量が得られます。

この演習では、MICE の典型的な流れである mice() - with() - pool() を実践します。biopics データを使って回帰分析を行い、被写体の職業(sub_type)と映画の収益の関係を調べましょう。

指示

100 XP
  • mice パッケージを読み込み、mice() を使って biopics を 5 回補完し、結果を biopics_multiimp に代入してください。
  • 各補完済みデータセットに対して、year と sub_type を使って earnings を説明する線形回帰モデルを当てはめ、結果を lm_multiimp に代入してください。
  • lm_multiimp に保存された回帰モデルをプールし、結果を lm_pooled に代入してください。
  • 信頼水準 95% の信頼区間が出力されるよう、lm_pooled を要約してください。