Pengodean variabel kategorikal - one-hot
Salah satu kolom dalam himpunan data volunteer, category_desc, memberikan deskripsi kategori untuk peluang relawan yang tercantum. Karena ini adalah variabel kategorikal dengan lebih dari dua kategori, kita perlu menggunakan one-hot encoding untuk mengubah kolom ini menjadi numerik. Gunakan fungsi pd.get_dummies() dari pandas untuk melakukannya.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Panggil
get_dummies()pada kolomvolunteer["category_desc"]untuk membuat kolom terenkode dan tetapkan kecategory_enc. - Cetak
.head()dari variabelcategory_encuntuk melihat sekilas kolom hasil encoding.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)