Membuat dummy dari variabel dua kategori
Disediakan sebuah basetable dengan satu variabel prediktor "gender". Pastikan "gender" dapat digunakan sebagai variabel prediktor dalam model regresi logistik dengan membuat variabel dummy untuknya.
Latihan ini adalah bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Petunjuk latihan
- Buat pandas dataframe
dummies_genderyang berisi variabel dummy untuk "gender". Pastikan untuk menghindari multikolinieritas. - Tambahkan dummy tersebut ke
basetableasli. - Hapus variabel asli "gender" dari
basetable.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())