Remplacer les données manquantes - II
Comme pour la plupart des opérations sur des séries temporelles, il existe plusieurs façons de traiter les valeurs manquantes. Comme vous l’avez vu dans l’exercice précédent, les approches locf et nocb vous amènent à faire certaines hypothèses sur les profils de croissance de vos données. Tandis que locf est plus conservatrice et nocb plus agressive, ces deux méthodes produisent une croissance en paliers à partir des données manquantes.
Mais que faire si vous avez de bonnes raisons d’attendre une croissance linéaire dans vos données ? Dans ce cas, il peut être plus pertinent d’utiliser une interpolation linéaire, qui génère de nouvelles valeurs entre les points encadrant la valeur manquante, pondérées en fonction du temps.
Dans cet exercice, vous allez compléter les valeurs manquantes de gdp_xts avec la commande na.approx(), qui utilise l’interpolation pour estimer des valeurs linéaires dans le temps.
Cet exercice fait partie du cours
Étude de cas : analyser des séries temporelles urbaines en R
Instructions
- Utilisez
na.approx()pour remplir les valeurs manquantes degdp_xtspar interpolation linéaire. Enregistrez ce nouvel objet xts sous le nomgdp_approx. - Tracez votre nouvel objet xts avec
plot.xts(). - Interrogez votre nouvel objet xts pour obtenir le PIB en 1993.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fill NAs in gdp_xts using linear approximation
gdp_approx <-
# Plot your new xts object
plot.xts(___, major.format = "%Y")
# Query for GDP in 1993 in gdp_approx