CommencerCommencer gratuitement

Catégorie

Pandas propose le type de données category, analogue au facteur en R.

Vous pouvez convertir une colonne en type catégoriel en passant 'category' à la méthode .astype(). Une fois la colonne convertie, vous pouvez voir les différentes catégories (appelées niveaux dans R) via l’accesseur .cat et l’attribut .categories.

Un autre cas d’usage des valeurs catégorielles est la préservation de l’ordre dans vos données. Par exemple, il est logique que « low » vienne avant « high ». Vous pouvez utiliser reorder_categories() pour définir l’ordre d’une colonne.

# Réordonner les niveaux catégoriels
df['column_name'].cat.reorder_categories(['low', 'high'], ordered=True)

Cet exercice fait partie du cours

Python pour les utilisateurs de R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Convert the type of time column
tips['time'] = ____

# Use the cat accessor to print the categories in the time column
print(____)
Modifier et exécuter le code