CommencerCommencer gratuitement

Imputer avec la méthode d’interpolation

Les séries temporelles présentent des tendances à la hausse et à la baisse au fil du temps. Pour cette raison, remplir des suites de valeurs de manière uniforme avec des méthodes comme le report vers l’avant (forward fill) ou vers l’arrière (backward fill) n’est pas adapté. Une imputation plus pertinente consiste à utiliser des méthodes linéaires ou quadratiques, où les valeurs manquantes sont remplacées par des valeurs qui augmentent ou diminuent progressivement.

Dans cet exercice, vous allez utiliser la méthode .interpolate() sur le DataFrame airquality. Vous appliquerez les méthodes linéaire, quadratique et nearest. Vous trouverez la liste détaillée des stratégies d’interpolation ici.

Cet exercice fait partie du cours

Gérer les données manquantes en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print prior to interpolation
print(airquality[30:40])

# Interpolate the NaNs linearly
airquality.interpolate(___, inplace=True)

# Print after interpolation
print(airquality[30:40])
Modifier et exécuter le code