1. Learn
  2. /
  3. Courses
  4. /
  5. R による欠損データの補完処理

Connected

Exercise

複数の変数タイプを用いたモデルベースの補完

条件付き分布からの抽出を組み込んだロジスティック回帰補完関数をうまく実装できましたね。かなり高度な統計処理をコードで表現しました。この演習では、これまでに学んだモデルベースの補完に関する知識を組み合わせて、tao データの異なる種類の変数を補完します。

前の章と同様に変数をループ処理し、次の2つの変数を補完してください。

  • is_hot:air_temp から作成された新しい二値変数で、air_temp が26度以上の場合は1、それ以外は0
  • humidity:これまでにも扱ってきた連続変数

以前学んだ線形回帰関数と、自分で作成したロジスティック回帰関数の両方を使います。さっそく始めましょう!

Instructions

100 XP
  • is_hot が元々欠損していた箇所を NA に設定してください。
  • sea_surface_temp のみを予測変数として、impute_logreg() 関数を使い、ロジスティック回帰で is_hot を補完してください。
  • humidity が元々欠損していた箇所を NA に設定してください。
  • sea_surface_temp と air_temp を予測変数として、線形回帰で humidity を補完してください。