1. Lära sig
  2. /
  3. Courses
  4. /
  5. Rで学ぶ特徴量エンジニアリング

Connected

exercise

欠損値の代入とダミー変数の作成

attrition データセットで欠損値を検出し、完全無作為欠損(MCAR)であると判断しました。そこで、K Nearest Neighbors(KNN)法で代入(インピュテーション)することにします。特徴量エンジニアリングの recipe を設定するにあたり、すべての名義変数に対してダミー変数を作成し、変数 ...1 のロールを「ID」に更新して、モデルには影響させず参照用にデータセットへ保持することにしました。

Instruktioner

100 XP
  • ...1 のロールを「ID」に更新します。
  • 欠損のあるすべての説明変数に値を代入します。
  • すべての名義の説明変数に対してダミー変数を作成します。