1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

カテゴリ変数のエンコーディング - ワンホット

volunteer データセットの列のひとつである category_desc には、掲載されているボランティア募集のカテゴリ説明が入っています。これは2種類を超えるカテゴリをもつカテゴリ変数なので、数値化するにはワンホットエンコーディングが必要です。pandas の pd.get_dummies() 関数を使ってこの列を変換しましょう。

指示

100 XP
  • volunteer["category_desc"] 列に対して get_dummies() を呼び出し、作成されたエンコード後の列を category_enc に代入します。
  • エンコード後の列を確認するため、変数 category_enc の .head() を出力します。