CommencerCommencer gratuitement

Encoder des variables catégorielles - binaire

Examinez le jeu de données hiking. Plusieurs colonnes doivent être encodées avant de pouvoir être utilisées dans un modèle, notamment la colonne Accessible. Accessible est une caractéristique binaire : elle prend deux valeurs, Y ou N, qui doivent être encodées en 1 et 0. Utilisez la méthode LabelEncoder de scikit-learn pour effectuer cette transformation.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Stockez LabelEncoder() dans une variable nommée enc.
  • En utilisant la méthode .fit_transform() de l’encodeur, encodez la colonne "Accessible" du jeu de données hiking. Nommez la nouvelle colonne Accessible_enc.
  • Comparez les deux colonnes côte à côte pour visualiser l’encodage.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Set up the LabelEncoder object
enc = ____

# Apply the encoding to the "Accessible" column
____ = ____.____(____)

# Compare the two columns
print(____[[____, ____]].head())
Modifier et exécuter le code