Aan de slagBegin gratis

Dummies maken van een variabele met veel categorieën

Gegeven is een basetable met één predictieve variabele "country". Zorg dat "country" als predictieve variabele kan worden gebruikt in een logistisch regressiemodel door er dummyvariabelen voor te maken.

Deze oefening maakt deel uit van de cursus

Gevorderde voorspellende analyse in Python

Bekijk cursus

Oefeninstructies

  • Maak een pandas-dataframe dummies_country met de dummyvariabelen voor "country". Zorg dat je multicollineariteit vermijdt.
  • Voeg deze dummies toe aan de originele basetable.
  • Verwijder de oorspronkelijke variabele "country" uit de basetable.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)

# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)

# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())
Code bewerken en uitvoeren