Agrupar categorías
Un problema que han manifestado los usuarios de un sitio web local de adopción de perros es que hay demasiadas opciones. Al buscar entre los distintos tipos de perros, se pierden en la abrumadora cantidad de opciones. Para simplificar algunos de los datos, repasa cada columna y, si procede, agrupa los datos. Para conservar los datos originales, vas a crear nuevas columnas actualizadas en el conjunto de datos dogs. Empezarás por la columna coat. La tabla de frecuencias aparece aquí:
short 1969
medium 565
wirehaired 220
long 180
medium-long 3
Este ejercicio forma parte del curso
Trabajar con datos categóricos en Python
Instrucciones del ejercicio
- Crea un diccionario llamado
update_coatspara asignar tantowirehairedcomomedium-longamedium. - Agrupa las categorías que aparecen en este nuevo diccionario y guárdalo como una nueva columna,
coat_collapsed. - Convierte esta nueva columna en una Serie categórica.
- Imprime la tabla de frecuencias de esta nueva Serie.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the update_coats dictionary
____
# Create a new column, coat_collapsed
dogs["coat_collapsed"] = ____
# Convert the column to categorical
____
# Print the frequency table
print(____)