Een dummy maken van een variabele met twee categorieën

Je krijgt een basetable met één predictieve variabele "gender". Zorg dat "gender" als predictieve variabele kan worden gebruikt in een logistisch regressiemodel door er dummyvariabelen voor te maken.

Deze oefening maakt deel uit van de cursus

Gevorderde voorspellende analyse in Python

Bekijk cursus

Oefeninstructies

Maak een pandas-dataframe dummies_gender met de dummyvariabelen voor "gender". Zorg dat je multicollineariteit vermijdt.
Voeg deze dummies toe aan de oorspronkelijke basetable.
Verwijder de oorspronkelijke variabele "gender" uit de basetable.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)

# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)

# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())

Code bewerken en uitvoeren