Categoria
Pandas oferece o tipo de dado category, que é análogo ao fator (factor) do R.
Você pode converter uma coluna para o tipo categórico passando 'category' para o método .astype().
Depois que tiver uma coluna categórica, você pode ver as várias categorias (conhecidas como levels em R) usando o acessor .cat e chamando o atributo .categories.
Outro caso de uso para valores categóricos é quando você quer preservar a ordem nos seus dados.
Por exemplo, faz sentido intuitivamente que 'low' venha antes de 'high'. Você pode usar reorder_categories() para definir uma ordem para uma coluna.
# Reordenar níveis categóricos
df['column_name'].cat.reorder_categories(['low', 'high'], ordered=True)
Este exercício faz parte do curso
Python para usuários de R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Convert the type of time column
tips['time'] = ____
# Use the cat accessor to print the categories in the time column
print(____)