1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ特徴量エンジニアリング

Connected

演習

前処理

Feature engineering の時間です! 観測 ID のように情報量は低いものの有用かもしれない変数への対応や、欠損値の処理を行うレシピを作成しましょう。また、いくつかの予測子を変換するよい機会でもあります。例えば、数値特徴量を正規化し、カテゴリ型のものにはダミー変数を作成します。

attritionデータセットと、前の演習で作成したtrainおよびtestの分割は、すでにあなたの環境に用意されています。

指示

100 XP
  • すべての数値特徴量を正規化します。
  • knn インピュテーションアルゴリズムで欠損値を補完します。
  • すべての名義尺度の予測子についてダミー変数を作成します。