Afficher des valeurs agrégées
Il arrive que vous deviez afficher vos données sous une forme plus agrégée. Par exemple, les données co2_levels sont hebdomadaires, mais vous pouvez avoir besoin d’afficher des valeurs agrégées par mois de l’année. Dans des jeux de données comme le DataFrame co2_levels où l’index est de type datetime, vous pouvez extraire l’année de chaque date de l’index :
# extraction de l’année de chaque date du DataFrame df
index_year = df.index.year
Pour extraire le mois ou le jour des dates dans les index du DataFrame df, utilisez respectivement df.index.month et df.index.day.
Vous pouvez ensuite utiliser l’année extraite de chaque index du DataFrame co2_levels et la fonction groupby pour calculer la moyenne des niveaux de CO2 par année :
df_by_year = df.groupby(index_year).mean()
Cet exercice fait partie du cours
Visualiser des séries temporelles en Python
Instructions
- Extrayez le mois pour chacune des dates dans l’index du DataFrame
co2_levelset affectez les valeurs à une variable appeléeindex_month. - En utilisant les fonctions
groupbyetmeande la bibliothèquepandas, calculez la moyenne mensuelle des niveaux de CO2 dans le DataFrameco2_levelset affectez le résultat à un nouveau DataFrame appelémean_co2_levels_by_month. - Tracez les valeurs du DataFrame
mean_co2_levels_by_monthen utilisant une taille de police de 6 pour les graduations des axes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get month for each dates in the index of co2_levels
index_month = ____.index.____
# Compute the mean CO2 levels for each month of the year
mean_co2_levels_by_month = co2_levels.____(____).____()
# Plot the mean CO2 levels for each month of the year
mean_co2_levels_by_month.____
# Specify the fontsize on the legend
plt.legend(fontsize=10)
# Show plot
plt.show()