Membuat dummy dari variabel dua kategori
Disediakan sebuah basetable dengan satu variabel prediktor "gender". Pastikan "gender" dapat digunakan sebagai variabel prediktor dalam model regresi logistik dengan membuat variabel dummy untuknya.
Latihan ini merupakan bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Instruksi latihan
- Buat pandas dataframe
dummies_genderyang berisi variabel dummy untuk "gender". Pastikan untuk menghindari multikolinieritas. - Tambahkan dummy tersebut ke
basetableasli. - Hapus variabel asli "gender" dari
basetable.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())