Aan de slagGa gratis aan de slag

Een dummy maken van een variabele met twee categorieën

Je krijgt een basetable met één predictieve variabele "gender". Zorg dat "gender" als predictieve variabele kan worden gebruikt in een logistisch regressiemodel door er dummyvariabelen voor te maken.

Deze oefening maakt deel uit van de cursus

Gevorderde voorspellende analyse in Python

Cursus bekijken

Oefeninstructies

  • Maak een pandas-dataframe dummies_gender met de dummyvariabelen voor "gender". Zorg dat je multicollineariteit vermijdt.
  • Voeg deze dummies toe aan de oorspronkelijke basetable.
  • Verwijder de oorspronkelijke variabele "gender" uit de basetable.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)

# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)

# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())
Code bewerken en uitvoeren