1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

カテゴリ変数のエンコーディング

scikit-learn でモデリングする前に、UFO データセットにはエンコードが必要な列がいくつかあります。ここでは、バイナリエンコーディングとワンホットエンコーディングの両方を使って変換していきます。

指示

100 XP
  • apply() を使い、値が "us" のときに 1、それ以外は 0 を返す条件付きの lambda 関数を書いてください。
  • type 列の .unique() 値の個数を出力してください。
  • pd.get_dummies() を使って、type 列のワンホットエンコード済みのセットを作成してください。
  • 最後に、pd.concat() を使って、エンコードした type_set 変数を ufo データセットに連結してください。