Encoder des variables catégorielles - binaire
Examinez le jeu de données hiking. Plusieurs colonnes doivent être encodées avant de pouvoir être utilisées dans un modèle, notamment la colonne Accessible. Accessible est une caractéristique binaire : elle prend deux valeurs, Y ou N, qui doivent être encodées en 1 et 0. Utilisez la méthode LabelEncoder de scikit-learn pour effectuer cette transformation.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Stockez
LabelEncoder()dans une variable nomméeenc. - En utilisant la méthode
.fit_transform()de l’encodeur, encodez la colonne"Accessible"du jeu de donnéeshiking. Nommez la nouvelle colonneAccessible_enc. - Comparez les deux colonnes côte à côte pour visualiser l’encodage.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())