Een dummy maken van een variabele met twee categorieën
Je krijgt een basetable met één predictieve variabele "gender". Zorg dat "gender" als predictieve variabele kan worden gebruikt in een logistisch regressiemodel door er dummyvariabelen voor te maken.
Deze oefening maakt deel uit van de cursus
Gevorderde voorspellende analyse in Python
Oefeninstructies
- Maak een pandas-dataframe
dummies_gendermet de dummyvariabelen voor "gender". Zorg dat je multicollineariteit vermijdt. - Voeg deze dummies toe aan de oorspronkelijke
basetable. - Verwijder de oorspronkelijke variabele "gender" uit de
basetable.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())