1. Учиться
  2. /
  3. Courses
  4. /
  5. Rで学ぶ特徴量エンジニアリング

Connected

Exercise

正規化と対数変換

あなたは、退職した従業員に関する数値データを含む attrition_num データセットを受け取りました。特徴量には、 Age、DistanceFromHome、MonthlyRate などがあります。

このデータを使って、従業員が会社に残るかどうかを予測するモデルを作成したいと考えています。目的変数は Attrition で、factor として符号化された二値変数です。モデリングの準備として、歪度を小さくし、スケールの違いによって一部の変数が他よりも過度に影響しないようにしたいです。

attrition_num データおよび train と test の分割は読み込まれています。

Инструкции

100 XP
  • すべての数値予測変数を正規化します。
  • すべての数値特徴量に、オフセットを 1 として対数変換を適用します。