1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで欠損データに対処する

Connected

연습 문제

DataFrame の序数エンコーディング

カテゴリ型の特徴量は、one-hot エンコーディングと序数(ordinal)エンコーディングの2つの手法でエンコードできます。one-hot エンコーディングでは、各カテゴリが1つの列になり、各行について当該カテゴリの列が 1、その他は 0 になります。序数エンコーディングでは、カテゴリを 0 からカテゴリ数−1 までの整数にマッピングします。

この演習では、users DataFrame のすべての列をループし、カテゴリを序数エンコーディングします。さらに、各列用のエンコーダを辞書 ordinal_enc_dict に保存し、エンコード後の列を元のカテゴリに戻せるようにします。

지침

100 XP
  • 空の辞書 ordinal_enc_dict を定義します。
  • 各列に対して Ordinal Encoder オブジェクトを作成します。
  • users の各列から非欠損の値を選択し、エンコードします。
  • エンコードした値を、users 内の各列(col_name)の非欠損の位置に代入して戻します。