Agrupar categorías
Un problema que han planteado los usuarios de un sitio web local de adopción de perros es que hay demasiadas opciones. Mientras miras los diferentes tipos de perros, te sientes perdido ante la abrumadora cantidad de opciones. Para simplificar algunos de los datos, repasa cada columna y, si procede, agrupa los datos. Para conservar los datos originales, vas a crear nuevas columnas actualizadas en el conjunto de datos « dogs
». Comenzarás con la columna « coat
». La tabla de frecuencias se muestra a continuación:
short 1969
medium 565
wirehaired 220
long 180
medium-long 3
Este ejercicio forma parte del curso
Trabajar con datos categóricos en Python
Instrucciones del ejercicio
- Crea un diccionario llamado
update_coats
para asignar tantowirehaired
comomedium-long
amedium
. - Agrupa las categorías que aparecen en este nuevo diccionario y guárdalo como una nueva columna,
coat_collapsed
. - Convierte esta nueva columna en una serie categórica.
- Imprime la tabla de frecuencias de esta nueva serie.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Create the update_coats dictionary
____
# Create a new column, coat_collapsed
dogs["coat_collapsed"] = ____
# Convert the column to categorical
____
# Print the frequency table
print(____)