Pengodean variabel kategorikal - one-hot
Salah satu kolom dalam himpunan data volunteer, category_desc, memberikan deskripsi kategori untuk peluang relawan yang tercantum. Karena ini adalah variabel kategorikal dengan lebih dari dua kategori, kita perlu menggunakan one-hot encoding untuk mengubah kolom ini menjadi numerik. Gunakan fungsi pd.get_dummies() dari pandas untuk melakukannya.
Latihan ini merupakan bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Instruksi latihan
- Panggil
get_dummies()pada kolomvolunteer["category_desc"]untuk membuat kolom terenkode dan tetapkan kecategory_enc. - Cetak
.head()dari variabelcategory_encuntuk melihat sekilas kolom hasil encoding.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)