Categorie
Pandas biedt het gegevenstype category, dat vergelijkbaar is met de factor in R.
Je kunt een kolom omzetten naar een categorisch gegevenstype door 'category' door te geven aan de methode .astype().
Zodra je een categorische kolom hebt, kun je de verschillende categorieën (bekend als levels in R) bekijken via de .cat-toegang en het attribuut .categories.
Een ander gebruik van categorische waarden is wanneer je de volgorde in je data wilt behouden.
Zo is het logisch dat 'low' vóór 'high' komt. Je kunt reorder_categories() gebruiken om een volgorde aan een kolom te geven.
# Categorieën opnieuw ordenen
df['column_name'].cat.reorder_categories(['low', 'high'], ordered=True)
Deze oefening maakt deel uit van de cursus
Python voor R-gebruikers
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Convert the type of time column
tips['time'] = ____
# Use the cat accessor to print the categories in the time column
print(____)