Utilizar .melt() para remodelar datos gubernamentales
El US Bureau of Labor Statistics (BLS) suele proporcionar series de datos en un formato fácil de leer: tiene una columna distinta para cada mes, y cada año es una fila diferente. Desgraciadamente, este amplio formato dificulta el trazado de esta información a lo largo del tiempo. En este ejercicio, reestructurarás una tabla de datos de la tasa de desempleo de EE. UU. del BLS en una forma que puedas representar gráficamente utilizando .melt()
. Tendrás que añadir una columna de fecha a la tabla y ordenar por ella para trazar los datos correctamente.
Los datos de la tasa de paro se han cargado para ti en una tabla llamada ur_wide
. Te animamos a que explores esta tabla antes de empezar el ejercicio.
Este ejercicio forma parte del curso
Unir datos con pandas
Instrucciones de ejercicio
- Utiliza
.melt()
para anular la dinamización de todas las columnas deur_wide
exceptoyear
y asegúrate de que las columnas con los meses y los valores se denominanmonth
yunempl_rate
, respectivamente. Guarda el resultado comour_tall
. - Añade una columna a
ur_tall
llamadadate
que combine las columnasyear
ymonth
como formato año-mes en una cadena mayor, y la convierta en un tipo de datos de fecha. - Ordena
ur_tall
por fecha y guárdalo comour_sorted
. - Utilizando
ur_sorted
, trazaunempl_rate
en el eje y ydate
en el eje x.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# unpivot everything besides the year column
ur_tall = ____
# Create a date column using the month and year columns of ur_tall
ur_tall['date'] = pd.to_datetime(ur_tall['____'] + '-' + ____)
# Sort ur_tall by date in ascending order
ur_sorted = ____
# Plot the unempl_rate by date
ur_sorted.plot(____)
plt.show()