CommencerCommencer gratuitement

Créer des dummies à partir d’une variable à de nombreuses modalités

On vous fournit un basetable avec une variable prédictive « country ». Assurez-vous que « country » puisse être utilisée comme variable prédictive dans un modèle de régression logistique en créant des variables indicatrices pour celle-ci.

Cet exercice fait partie du cours

Analytique prédictive intermédiaire en Python

Afficher le cours

Instructions

  • Créez un dataframe pandas dummies_country contenant les variables indicatrices pour « country ». Veillez à éviter la multicolinéarité.
  • Ajoutez ces dummies au basetable d’origine.
  • Supprimez la variable d’origine « country » du basetable.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)

# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)

# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())
Modifier et exécuter le code