CommencerCommencez gratuitement

Médiane et écart-type glissants sur 360 jours pour l’ozone à New York depuis 2000

La dernière vidéo vous a également montré comment calculer plusieurs statistiques glissantes avec la méthode .agg(), de façon similaire à .groupby().

Observons de plus près l’historique de la qualité de l’air à New York à partir des données d’ozone que vous avez déjà vues. Les données quotidiennes sont très volatiles ; une moyenne glissante de plus longue durée peut aider à faire ressortir la tendance de fond.

Vous utiliserez une fenêtre glissante de 360 jours et .agg() pour calculer la moyenne et l’écart-type glissants des valeurs quotidiennes moyennes d’ozone depuis 2000.

Cet exercice fait partie du cours

<cours>Manipuler des séries temporelles en Python</cours>
Voir le cours

Instructions de l’exercice

Nous avons déjà importé pandas sous le nom pd et matplotlib.pyplot sous le nom plt.

  • Utilisez pd.read_csv() pour importer 'ozone.csv', en créant un DateTimeIndex à partir de la colonne 'date' avec parse_dates et index_col, affectez le résultat à data, puis supprimez les valeurs manquantes avec .dropna().
  • Sélectionnez la colonne 'Ozone' et créez une fenêtre .rolling() de 360 périodes, appliquez .agg() pour calculer mean et std, et affectez le résultat à rolling_stats.
  • Utilisez .join() pour concaténer data avec rolling_stats, et affectez le résultat à stats.
  • Tracez stats en utilisant subplots.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import and inspect ozone data here
data = ____

# Calculate the rolling mean and std here
rolling_stats = ____

# Join rolling_stats with ozone data
stats = ____

# Plot stats


Modifier et exécuter le code