MulaiMulai sekarang secara gratis

Pengodean variabel kategorikal - one-hot

Salah satu kolom dalam himpunan data volunteer, category_desc, memberikan deskripsi kategori untuk peluang relawan yang tercantum. Karena ini adalah variabel kategorikal dengan lebih dari dua kategori, kita perlu menggunakan one-hot encoding untuk mengubah kolom ini menjadi numerik. Gunakan fungsi pd.get_dummies() dari pandas untuk melakukannya.

Latihan ini adalah bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Panggil get_dummies() pada kolom volunteer["category_desc"] untuk membuat kolom terenkode dan tetapkan ke category_enc.
  • Cetak .head() dari variabel category_enc untuk melihat sekilas kolom hasil encoding.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Edit dan Jalankan Kode