Pengodean variabel kategorikal
Ada beberapa kolom dalam himpunan data UFO yang perlu dikodekan sebelum dapat dimodelkan dengan scikit-learn. Anda akan melakukan transformasi tersebut di sini, menggunakan metode pengodean biner dan one-hot.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Dengan
apply(), tulis fungsilambdabersyarat yang mengembalikan1jika nilainya"us", selain itu kembalikan 0. - Cetak jumlah nilai
.unique()pada kolomtype. - Dengan
pd.get_dummies(), buat satu set one-hot encoded dari kolomtype. - Terakhir, gunakan
pd.concat()untuk menggabungkan variabel terenkodetype_setke himpunan dataufo.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use pandas to encode us values as 1 and others as 0
ufo["country_enc"] = ufo["country"].____
# Print the number of unique type values
print(len(____.unique()))
# Create a one-hot encoded set of the type values
type_set = ____
# Concatenate this set back to the ufo DataFrame
ufo = pd.concat([____, ____], axis=1)