Categoria
Pandas offre il tipo di dato category, analogo al factor in R.
Puoi convertire una colonna in un tipo di dato categorico passando 'category' al metodo .astype().
Una volta che hai una colonna categorica, puoi vedere le varie categorie (chiamate levels in R) usando l’accessor .cat e l’attributo .categories.
Un altro caso d’uso per i valori categorici è quando vuoi preservare un ordinamento nei dati.
Per esempio, intuitivamente ha senso che 'low' venga prima di 'high'. Puoi usare reorder_categories() per definire un ordine a una colonna.
# Riordina i livelli della variabile categorica
df['column_name'].cat.reorder_categories(['low', 'high'], ordered=True)
Questo esercizio fa parte del corso
Python per utenti R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Convert the type of time column
tips['time'] = ____
# Use the cat accessor to print the categories in the time column
print(____)