Aan de slagGa gratis aan de slag

Dummies maken van een variabele met veel categorieën

Gegeven is een basetable met één predictieve variabele "country". Zorg dat "country" als predictieve variabele kan worden gebruikt in een logistisch regressiemodel door er dummyvariabelen voor te maken.

Deze oefening maakt deel uit van de cursus

Gevorderde voorspellende analyse in Python

Cursus bekijken

Oefeninstructies

  • Maak een pandas-dataframe dummies_country met de dummyvariabelen voor "country". Zorg dat je multicollineariteit vermijdt.
  • Voeg deze dummies toe aan de originele basetable.
  • Verwijder de oorspronkelijke variabele "country" uit de basetable.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)

# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)

# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())
Code bewerken en uitvoeren