Membuat dummy dari variabel dengan banyak kategori
Diberikan sebuah basetable dengan satu variabel prediktor "country". Pastikan "country" dapat digunakan sebagai variabel prediktor dalam model regresi logistik dengan membuat variabel dummy untuknya.
Latihan ini adalah bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Petunjuk latihan
- Buat dataframe pandas
dummies_countryyang berisi variabel dummy untuk "country". Pastikan Anda menghindari multikolinearitas. - Tambahkan dummy tersebut ke
basetableasli. - Hapus variabel asli "country" dari
basetable.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)
# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)
# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())