One-hot encoding dan variabel dummy
Untuk menggunakan variabel kategorikal dalam model Machine Learning, Anda perlu merepresentasikannya secara kuantitatif. Dua pendekatan yang paling umum adalah melakukan one-hot encoding pada variabel atau menggunakan variabel dummy. Pada latihan ini, Anda akan membuat kedua jenis pengodean tersebut dan membandingkan kumpulan kolom yang dihasilkan. Kita akan terus menggunakan DataFrame yang sama dari pelajaran sebelumnya yang dimuat sebagai so_survey_df dan berfokus pada kolom Country.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk Machine Learning di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Convert the Country column to a one hot encoded Data Frame
one_hot_encoded = ____(____, ____=['Country'], prefix='OH')
# Print the columns names
print(one_hot_encoded.columns)