CommencerCommencez gratuitement

Créer une variable indicatrice à partir d’une variable à deux modalités

On vous fournit un basetable avec une seule variable prédictive "gender". Assurez-vous que "gender" puisse être utilisée comme variable prédictive dans un modèle de régression logistique en créant des variables indicatrices pour cette variable.

Cet exercice fait partie du cours

<cours>Analytique prédictive intermédiaire en Python</cours>
Voir le cours

Instructions de l’exercice

  • Créez un dataframe pandas dummies_gender qui contient les variables indicatrices pour "gender". Veillez à éviter la multicolinéarité.
  • Ajoutez ces indicatrices au basetable d’origine.
  • Supprimez la variable d’origine "gender" du basetable.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)

# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)

# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())
Modifier et exécuter le code