Encodage des variables catégorielles - one-hot
L’une des colonnes du jeu de données volunteer, category_desc, contient les descriptions de catégorie des opportunités de bénévolat. Comme il s’agit d’une variable catégorielle avec plus de deux catégories, nous devons utiliser un encodage one-hot pour transformer cette colonne en valeurs numériques. Utilisez la fonction pd.get_dummies() de pandas pour cela.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Appelez
get_dummies()sur la colonnevolunteer["category_desc"]pour créer les colonnes encodées et assignez le résultat àcategory_enc. - Affichez le
.head()de la variablecategory_encpour examiner les colonnes encodées.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Transform the category_desc column
category_enc = pd.____(____)
# Take a look at the encoded columns
print(____)