CommencerCommencer gratuitement

Gérer les valeurs manquantes

Au chapitre 3, vous avez utilisé na.locf() pour remplacer les valeurs manquantes par la dernière valeur non manquante. Vous pouvez recourir à l’interpolation lorsque reporter la valeur précédente n’est pas approprié. Dans cet exercice, vous allez explorer deux méthodes d’interpolation : linéaire et spline.

L’interpolation linéaire calcule des valeurs situées sur la droite reliant deux points de données connus. C’est un bon choix pour des données assez linéaires, comme une série avec une forte tendance. L’interpolation par spline est plus adaptée aux séries sans tendance marquée, car elle calcule une approximation non linéaire à partir de plusieurs points de données.

Utilisez ces deux méthodes pour interpoler les trois valeurs manquantes du taux du Trésor à 10 ans dans l’objet DGS10. Comparez ensuite les résultats avec la sortie de na.locf().

Cet exercice fait partie du cours

Importer et gérer des données financières avec R

Afficher le cours

Instructions

  • Complétez la commande pour utiliser na.approx() et remplir les valeurs manquantes par interpolation linéaire.
  • Complétez la commande pour utiliser na.spline() et remplir les valeurs manquantes par interpolation spline.
  • Fusionnez locf, approx et spline dans un seul objet nommé na_filled.
  • Complétez la commande pour tracer na_filled.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# fill NA using last observation carried forward
locf <- na.locf(DGS10)

# fill NA using linear interpolation
approx <- ___(DGS10)

# fill NA using spline interpolation
spline <- ___(DGS10)

# merge into one object


# plot combined object
___(___, col = c("black", "red", "green"))
Modifier et exécuter le code