Créer des dummies à partir d’une variable à de nombreuses modalités
On vous fournit un basetable avec une variable prédictive « country ». Assurez-vous que « country » puisse être utilisée comme variable prédictive dans un modèle de régression logistique en créant des variables indicatrices pour celle-ci.
Cet exercice fait partie du cours
Analytique prédictive intermédiaire en Python
Instructions
- Créez un dataframe pandas
dummies_countrycontenant les variables indicatrices pour « country ». Veillez à éviter la multicolinéarité. - Ajoutez ces dummies au
basetabled’origine. - Supprimez la variable d’origine « country » du
basetable.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the dummy variable
dummies_country = ____.____(____["____"], ____=____)
# Add the dummy variable to the basetable
basetable = ____.____([____, ____], ____=____)
# Delete the original variable from the basetable
____ ____["____"]
print(basetable.head())