Mulai sekarangMulai gratis

Pengodean variabel kategorikal - one-hot

Salah satu kolom dalam himpunan data volunteer, category_desc, memberikan deskripsi kategori untuk peluang relawan yang tercantum. Karena ini adalah variabel kategorikal dengan lebih dari dua kategori, kita perlu menggunakan one-hot encoding untuk mengubah kolom ini menjadi numerik. Gunakan fungsi pd.get_dummies() dari pandas untuk melakukannya.

Latihan ini merupakan bagian dari kursus

Prapemrosesan untuk Machine Learning di Python

Lihat Kursus

Instruksi latihan

  • Panggil get_dummies() pada kolom volunteer["category_desc"] untuk membuat kolom terenkode dan tetapkan ke category_enc.
  • Cetak .head() dari variabel category_enc untuk melihat sekilas kolom hasil encoding.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Edit dan Jalankan Kode