1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Pythonで欠損データに対処する

Connected

Exercises

DataFrame の序数エンコーディング

カテゴリ型の特徴量は、one-hot エンコーディングと序数(ordinal)エンコーディングの2つの手法でエンコードできます。one-hot エンコーディングでは、各カテゴリが1つの列になり、各行について当該カテゴリの列が 1、その他は 0 になります。序数エンコーディングでは、カテゴリを 0 からカテゴリ数−1 までの整数にマッピングします。

この演習では、users DataFrame のすべての列をループし、カテゴリを序数エンコーディングします。さらに、各列用のエンコーダを辞書 ordinal_enc_dict に保存し、エンコード後の列を元のカテゴリに戻せるようにします。

คำแนะนำ

100 XP
  • 空の辞書 ordinal_enc_dict を定義します。
  • 各列に対して Ordinal Encoder オブジェクトを作成します。
  • users の各列から非欠損の値を選択し、エンコードします。
  • エンコードした値を、users 内の各列(col_name)の非欠損の位置に代入して戻します。