Aan de slagGa gratis aan de slag

Omgaan met ontbrekende waarden

In hoofdstuk 3 gebruikte je na.locf() om ontbrekende waarden op te vullen met de vorige niet-ontbrekende waarde. Je kunt interpolatie gebruiken wanneer de vorige waarde doortrekken niet passend is. In deze oefening verken je twee interpolatiemethoden: lineair en spline.

Lineaire interpolatie berekent waarden die op een lijn liggen tussen twee bekende datapunten. Dit is een goede keuze voor redelijk lineaire data, zoals een reeks met een sterke trend. Spline-interpolatie is geschikter voor reeksen zonder sterke trend, omdat het een niet-lineaire benadering berekent met meerdere datapunten.

Gebruik deze twee methoden om de drie ontbrekende waarden voor het 10-jaars Treasury-rendement in het object DGS10 te interpoleren. Vergelijk daarna de resultaten met de uitvoer van na.locf().

Deze oefening maakt deel uit van de cursus

Financiële gegevens importeren en beheren in R

Cursus bekijken

Oefeninstructies

  • Maak het commando af om na.approx() te gebruiken om ontbrekende waarden op te vullen met lineaire interpolatie.
  • Maak het commando af om na.spline() te gebruiken om ontbrekende waarden op te vullen met spline-interpolatie.
  • Voeg locf, approx en spline samen in één object met de naam na_filled.
  • Maak het commando af om na_filled te plotten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# fill NA using last observation carried forward
locf <- na.locf(DGS10)

# fill NA using linear interpolation
approx <- ___(DGS10)

# fill NA using spline interpolation
spline <- ___(DGS10)

# merge into one object


# plot combined object
___(___, col = c("black", "red", "green"))
Code bewerken en uitvoeren