Médiane et écart-type glissants sur 360 jours pour l’ozone à New York depuis 2000
La dernière vidéo vous a également montré comment calculer plusieurs statistiques glissantes avec la méthode .agg(), de façon similaire à .groupby().
Observons de plus près l’historique de la qualité de l’air à New York à partir des données d’ozone que vous avez déjà vues. Les données quotidiennes sont très volatiles ; une moyenne glissante de plus longue durée peut aider à faire ressortir la tendance de fond.
Vous utiliserez une fenêtre glissante de 360 jours et .agg() pour calculer la moyenne et l’écart-type glissants des valeurs quotidiennes moyennes d’ozone depuis 2000.
Cet exercice fait partie du cours
Manipuler des séries temporelles en Python
Instructions
Nous avons déjà importé pandas sous le nom pd et matplotlib.pyplot sous le nom plt.
- Utilisez
pd.read_csv()pour importer'ozone.csv', en créant unDateTimeIndexà partir de la colonne'date'avecparse_datesetindex_col, affectez le résultat àdata, puis supprimez les valeurs manquantes avec.dropna(). - Sélectionnez la colonne
'Ozone'et créez une fenêtre.rolling()de 360 périodes, appliquez.agg()pour calculermeanetstd, et affectez le résultat àrolling_stats. - Utilisez
.join()pour concaténerdataavecrolling_stats, et affectez le résultat àstats. - Tracez
statsen utilisantsubplots.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats