1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでの欠損データの扱い方

Connected

演習

simputation を使ってデータを補完する

R には多くの欠損値補完パッケージがあります。ここでは、シンプルで強力なインターフェースを提供する simputation パッケージに注目して、補完を実行していきます。

良い補完モデルを作ることはとても重要ですが、同時に複雑なテーマでもあります。優れた統計モデルを作るのと同じくらい、補完モデル作成にも多くの工夫が必要です。本コースでは、補完結果をどのように評価するかに焦点を当てます。

まずは、指定した線形モデルに基づいて値を補完する impute_lm() 関数の使い方を見ていきます。

この演習では、impute_lm() を用いて作成したデータに、これまでの評価手法を適用します。さらに続くレッスンで、この補完方法を発展させていきます。

指示

100 XP

oceanbuoys データセットを使って、次を行ってください。

  • humidity を wind_ew と wind_ns で補完し、add_label_shadow() で欠損の有無を記録します。
  • air_temp_c と humidity の補完後の値をプロットし、x 軸に air_temp_c、y 軸に humidity を置き、色分けは any_missing() によって行います。