Catégorie
Pandas propose le type de données category, analogue au facteur en R.
Vous pouvez convertir une colonne en type catégoriel en passant 'category' à la méthode .astype().
Une fois la colonne convertie, vous pouvez voir les différentes catégories (appelées niveaux dans R) via l’accesseur .cat et l’attribut .categories.
Un autre cas d’usage des valeurs catégorielles est la préservation de l’ordre dans vos données.
Par exemple, il est logique que « low » vienne avant « high ». Vous pouvez utiliser reorder_categories() pour définir l’ordre d’une colonne.
# Réordonner les niveaux catégoriels
df['column_name'].cat.reorder_categories(['low', 'high'], ordered=True)
Cet exercice fait partie du cours
Python pour les utilisateurs de R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert the type of time column
tips['time'] = ____
# Use the cat accessor to print the categories in the time column
print(____)