Créer une variable indicatrice à partir d’une variable à deux modalités
On vous fournit un basetable avec une seule variable prédictive "gender". Assurez-vous que "gender" puisse être utilisée comme variable prédictive dans un modèle de régression logistique en créant des variables indicatrices pour cette variable.
Cet exercice fait partie du cours
Analytique prédictive intermédiaire en Python
Instructions
- Créez un dataframe pandas
dummies_genderqui contient les variables indicatrices pour "gender". Veillez à éviter la multicolinéarité. - Ajoutez ces indicatrices au
basetabled’origine. - Supprimez la variable d’origine "gender" du
basetable.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())