Inizia subitoInizia gratis

Categoria

Pandas offre il tipo di dato category, analogo al factor in R.

Puoi convertire una colonna in un tipo di dato categorico passando 'category' al metodo .astype(). Una volta che hai una colonna categorica, puoi vedere le varie categorie (chiamate levels in R) usando l’accessor .cat e l’attributo .categories.

Un altro caso d’uso per i valori categorici è quando vuoi preservare un ordinamento nei dati. Per esempio, intuitivamente ha senso che 'low' venga prima di 'high'. Puoi usare reorder_categories() per definire un ordine a una colonna.

# Riordina i livelli della variabile categorica
df['column_name'].cat.reorder_categories(['low', 'high'], ordered=True)

Questo esercizio fa parte del corso

Python per utenti R

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Convert the type of time column
tips['time'] = ____

# Use the cat accessor to print the categories in the time column
print(____)
Modifica ed esegui il codice