CommencerCommencer gratuitement

Créer une variable indicatrice à partir d’une variable à deux modalités

On vous fournit un basetable avec une seule variable prédictive "gender". Assurez-vous que "gender" puisse être utilisée comme variable prédictive dans un modèle de régression logistique en créant des variables indicatrices pour cette variable.

Cet exercice fait partie du cours

Analytique prédictive intermédiaire en Python

Afficher le cours

Instructions

  • Créez un dataframe pandas dummies_gender qui contient les variables indicatrices pour "gender". Veillez à éviter la multicolinéarité.
  • Ajoutez ces indicatrices au basetable d’origine.
  • Supprimez la variable d’origine "gender" du basetable.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)

# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)

# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())
Modifier et exécuter le code