Mostrar valores agregados
A veces puede que necesites mostrar tus datos en una forma más agregada. Por ejemplo, los datos de co2_levels son semanales, pero quizá necesites mostrar sus valores agregados por mes del año. En conjuntos de datos como el DataFrame co2_levels, donde el índice es de tipo datetime, puedes extraer el año de cada fecha del índice:
# extrae el año de cada fecha del DataFrame df
index_year = df.index.year
Para extraer el mes o el día de las fechas en los índices del DataFrame df, usarías df.index.month y df.index.day, respectivamente.
Luego puedes usar el año extraído de cada índice en el DataFrame co2_levels y la función groupby para calcular los niveles medios de CO2 por año:
df_by_year = df.groupby(index_year).mean()
Este ejercicio forma parte del curso
Visualización de datos temporales en Python
Instrucciones del ejercicio
- Extrae el mes para cada una de las fechas en el índice del DataFrame
co2_levelsy asigna los valores a una variable llamadaindex_month. - Usando las funciones
groupbyymeande la libreríapandas, calcula la media mensual de los niveles de CO2 en el DataFrameco2_levelsy asígnala a un nuevo DataFrame llamadomean_co2_levels_by_month. - Representa los valores del DataFrame
mean_co2_levels_by_monthusando un tamaño de fuente de 6 para las marcas de los ejes.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Get month for each dates in the index of co2_levels
index_month = ____.index.____
# Compute the mean CO2 levels for each month of the year
mean_co2_levels_by_month = co2_levels.____(____).____()
# Plot the mean CO2 levels for each month of the year
mean_co2_levels_by_month.____
# Specify the fontsize on the legend
plt.legend(fontsize=10)
# Show plot
plt.show()