Membuat dummy dari variabel dengan banyak kategori
Diberikan sebuah basetable dengan satu variabel prediktor "country". Pastikan "country" dapat digunakan sebagai variabel prediktor dalam model regresi logistik dengan membuat variabel dummy untuknya.
Latihan ini merupakan bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Instruksi latihan
- Buat dataframe pandas
dummies_countryyang berisi variabel dummy untuk "country". Pastikan Anda menghindari multikolinearitas. - Tambahkan dummy tersebut ke
basetableasli. - Hapus variabel asli "country" dari
basetable.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)
# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)
# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())