Colapso de categorias
Um problema que os usuários de um site local de adoção de cães expressaram é que há muitas opções. Ao examinarem os diferentes tipos de cães, eles se perdem em meio à enorme quantidade de opções. Para simplificar alguns dos dados, você está percorrendo cada coluna e colapsando os dados, se for o caso. Para preservar os dados originais, você criará novas colunas atualizadas no conjunto de dados dogs
. Você começará com a coluna coat
. A tabela de frequência está listada aqui:
short 1969
medium 565
wirehaired 220
long 180
medium-long 3
Este exercício faz parte do curso
Trabalhando com dados categóricos em Python
Instruções de exercício
- Crie um dicionário chamado
update_coats
para mapearwirehaired
emedium-long
paramedium
. - Recolha as categorias listadas nesse novo dicionário e salve-as como uma nova coluna,
coat_collapsed
. - Converta essa nova coluna em uma série categórica.
- Imprima a tabela de frequência dessa nova série.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create the update_coats dictionary
____
# Create a new column, coat_collapsed
dogs["coat_collapsed"] = ____
# Convert the column to categorical
____
# Print the frequency table
print(____)