Créer une variable indicatrice à partir d’une variable à deux modalités
On vous fournit un basetable avec une seule variable prédictive "gender". Assurez-vous que "gender" puisse être utilisée comme variable prédictive dans un modèle de régression logistique en créant des variables indicatrices pour cette variable.
Cet exercice fait partie du cours
<cours>Analytique prédictive intermédiaire en Python</cours>Instructions de l’exercice
- Créez un dataframe pandas
dummies_genderqui contient les variables indicatrices pour "gender". Veillez à éviter la multicolinéarité. - Ajoutez ces indicatrices au
basetabled’origine. - Supprimez la variable d’origine "gender" du
basetable.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Create the dummy variable
dummies_gender = pd.____(____["____"], drop_first=____)
# Add the dummy variable to the basetable
basetable = pd.concat([____, ____], axis=1)
# Delete the original variable from the basetable
del basetable["____"]
print(basetable.head())