Médiane et écart-type glissants sur 360 jours pour l’ozone à New York depuis 2000

La dernière vidéo vous a également montré comment calculer plusieurs statistiques glissantes avec la méthode .agg(), de façon similaire à .groupby().

Observons de plus près l’historique de la qualité de l’air à New York à partir des données d’ozone que vous avez déjà vues. Les données quotidiennes sont très volatiles ; une moyenne glissante de plus longue durée peut aider à faire ressortir la tendance de fond.

Vous utiliserez une fenêtre glissante de 360 jours et .agg() pour calculer la moyenne et l’écart-type glissants des valeurs quotidiennes moyennes d’ozone depuis 2000.

Cet exercice fait partie du cours

Manipuler des séries temporelles en Python

Afficher le cours

Instructions

Nous avons déjà importé pandas sous le nom pd et matplotlib.pyplot sous le nom plt.

Utilisez pd.read_csv() pour importer 'ozone.csv', en créant un DateTimeIndex à partir de la colonne 'date' avec parse_dates et index_col, affectez le résultat à data, puis supprimez les valeurs manquantes avec .dropna().
Sélectionnez la colonne 'Ozone' et créez une fenêtre .rolling() de 360 périodes, appliquez .agg() pour calculer mean et std, et affectez le résultat à rolling_stats.
Utilisez .join() pour concaténer data avec rolling_stats, et affectez le résultat à stats.
Tracez stats en utilisant subplots.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import and inspect ozone data here
data = ____

# Calculate the rolling mean and std here
rolling_stats = ____

# Join rolling_stats with ozone data
stats = ____

# Plot stats

Modifier et exécuter le code