CommencerCommencer gratuitement

Encodage des variables catégorielles - one-hot

L’une des colonnes du jeu de données volunteer, category_desc, contient les descriptions de catégorie des opportunités de bénévolat. Comme il s’agit d’une variable catégorielle avec plus de deux catégories, nous devons utiliser un encodage one-hot pour transformer cette colonne en valeurs numériques. Utilisez la fonction pd.get_dummies() de pandas pour cela.

Cet exercice fait partie du cours

Prétraitement pour le Machine Learning en Python

Afficher le cours

Instructions

  • Appelez get_dummies() sur la colonne volunteer["category_desc"] pour créer les colonnes encodées et assignez le résultat à category_enc.
  • Affichez le .head() de la variable category_enc pour examiner les colonnes encodées.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Transform the category_desc column
category_enc = pd.____(____)

# Take a look at the encoded columns
print(____)
Modifier et exécuter le code