Imputer avec la méthode d’interpolation
Les séries temporelles présentent des tendances à la hausse et à la baisse au fil du temps. Pour cette raison, remplir des suites de valeurs de manière uniforme avec des méthodes comme le report vers l’avant (forward fill) ou vers l’arrière (backward fill) n’est pas adapté. Une imputation plus pertinente consiste à utiliser des méthodes linéaires ou quadratiques, où les valeurs manquantes sont remplacées par des valeurs qui augmentent ou diminuent progressivement.
Dans cet exercice, vous allez utiliser la méthode .interpolate() sur le DataFrame airquality. Vous appliquerez les méthodes linéaire, quadratique et nearest. Vous trouverez la liste détaillée des stratégies d’interpolation ici.
Cet exercice fait partie du cours
Gérer les données manquantes en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print prior to interpolation
print(airquality[30:40])
# Interpolate the NaNs linearly
airquality.interpolate(___, inplace=True)
# Print after interpolation
print(airquality[30:40])