Quantiles roulants pour la qualité de l’air quotidienne à NYC
Dans la dernière vidéo, vous avez appris à calculer des quantiles roulants pour décrire l’évolution de la dispersion d’une série temporelle au fil du temps, d’une manière moins sensible aux valeurs aberrantes que l’utilisation de la moyenne et de l’écart type.
Calculons les quantiles roulants — à 10 %, 50 % (médiane) et 90 % — de la distribution de la concentration moyenne quotidienne d’ozone à NYC à l’aide d’une fenêtre roulante de 360 jours.
Cet exercice fait partie du cours
Manipuler des séries temporelles en Python
Instructions
Nous avons déjà importé pandas sous le nom pd et matplotlib.pyplot sous le nom plt. Nous avons également chargé les données d’ozone de 2000 à 2017 dans la variable data.
- Appliquez
.resample()avec la fréquence quotidienne'D'àdata, puis appliquez.interpolate()pour combler les valeurs manquantes, et réaffectez le résultat àdata. - Examinez le résultat avec
.info(). - Créez une fenêtre
.rolling()de 360 périodes, sélectionnez la colonne'Ozone'et affectez le résultat àrolling. - Insérez trois nouvelles colonnes,
'q10','q50'et'q90'dansdata, en calculant les quantiles correspondants à partir derolling. - Tracez
data.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Resample, interpolate and inspect ozone data here
data = ____
# Create the rolling window
rolling = ____
# Insert the rolling quantiles to the monthly returns
data['q10'] = ____
data['q50'] = ____
data['q90'] = ____
# Plot the data