Médiane et écart-type glissants sur 360 jours pour l’ozone à New York depuis 2000
La dernière vidéo vous a également montré comment calculer plusieurs statistiques glissantes avec la méthode .agg(), de façon similaire à .groupby().
Observons de plus près l’historique de la qualité de l’air à New York à partir des données d’ozone que vous avez déjà vues. Les données quotidiennes sont très volatiles ; une moyenne glissante de plus longue durée peut aider à faire ressortir la tendance de fond.
Vous utiliserez une fenêtre glissante de 360 jours et .agg() pour calculer la moyenne et l’écart-type glissants des valeurs quotidiennes moyennes d’ozone depuis 2000.
Cet exercice fait partie du cours
<cours>Manipuler des séries temporelles en Python</cours>Instructions de l’exercice
Nous avons déjà importé pandas sous le nom pd et matplotlib.pyplot sous le nom plt.
- Utilisez
pd.read_csv()pour importer'ozone.csv', en créant unDateTimeIndexà partir de la colonne'date'avecparse_datesetindex_col, affectez le résultat àdata, puis supprimez les valeurs manquantes avec.dropna(). - Sélectionnez la colonne
'Ozone'et créez une fenêtre.rolling()de 360 périodes, appliquez.agg()pour calculermeanetstd, et affectez le résultat àrolling_stats. - Utilisez
.join()pour concaténerdataavecrolling_stats, et affectez le résultat àstats. - Tracez
statsen utilisantsubplots.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats