Gérer les valeurs manquantes
Au chapitre 3, vous avez utilisé na.locf() pour remplacer les valeurs manquantes par la dernière valeur non manquante. Vous pouvez recourir à l’interpolation lorsque reporter la valeur précédente n’est pas approprié. Dans cet exercice, vous allez explorer deux méthodes d’interpolation : linéaire et spline.
L’interpolation linéaire calcule des valeurs situées sur la droite reliant deux points de données connus. C’est un bon choix pour des données assez linéaires, comme une série avec une forte tendance. L’interpolation par spline est plus adaptée aux séries sans tendance marquée, car elle calcule une approximation non linéaire à partir de plusieurs points de données.
Utilisez ces deux méthodes pour interpoler les trois valeurs manquantes du taux du Trésor à 10 ans dans l’objet DGS10. Comparez ensuite les résultats avec la sortie de na.locf().
Cet exercice fait partie du cours
Importer et gérer des données financières avec R
Instructions
- Complétez la commande pour utiliser
na.approx()et remplir les valeurs manquantes par interpolation linéaire. - Complétez la commande pour utiliser
na.spline()et remplir les valeurs manquantes par interpolation spline. - Fusionnez
locf,approxetsplinedans un seul objet nomména_filled. - Complétez la commande pour tracer
na_filled.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# fill NA using last observation carried forward
locf <- na.locf(DGS10)
# fill NA using linear interpolation
approx <- ___(DGS10)
# fill NA using spline interpolation
spline <- ___(DGS10)
# merge into one object
# plot combined object
___(___, col = c("black", "red", "green"))