1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

演習

ワンホットエンコーディングとダミー変数

カテゴリ変数をMachine Learningモデルで使うには、まず数量的に表現する必要があります。最も一般的な方法は、ワンホットエンコーディングを用いるか、ダミー変数を作成することです。この演習では、両方のエンコーディングを作成し、生成された列セットを比較します。前のレッスンと同じDataFrame so_survey_df を使い、Country 列に注目します。

指示1 / 2

undefined XP
  • 1

    Country 列をワンホットエンコードし、各列の接頭辞として "OH" を付けてください。

  • 2

    Country 列のダミー変数を作成し、各列の接頭辞として "DM" を付けてください。