Fehlende Daten ersetzen – II
Wie bei den meisten Aspekten der Zeitreihenmanipulation gibt es viele Möglichkeiten, mit fehlenden Werten umzugehen. Wie du in der vorherigen Übung gesehen hast, erfordern sowohl der locf- als auch der nocb-Ansatz bestimmte Annahmen über Wachstumsmuster in deinen Daten. Während locf konservativer ist und nocb aggressiver, erzeugen beide stufenweises Wachstum aus fehlenden Werten.
Was aber, wenn du lineares Wachstum in deinen Daten erwartest? Dann ist lineare Interpolation sinnvoller. Dabei werden neue Werte zwischen den Daten an den Rändern des fehlenden Werts erzeugt und zeitlich gewichtet.
In dieser Übung füllst du die fehlenden Werte in deinen gdp_xts-Daten mit dem Befehl na.approx(), der per Interpolation lineare Werte über die Zeit schätzt.
Diese Übung ist Teil des Kurses
Fallstudie: Zeitreihendaten von Städten in R analysieren
Anleitung zur Übung
- Verwende
na.approx(), um die fehlenden Werte ingdp_xtsmithilfe linearer Interpolation zu füllen. Speichere das neue xts-Objekt alsgdp_approx. - Zeichne dein neues xts-Objekt mit
plot.xts(). - Frage in deinem neuen xts-Objekt das BIP für 1993 ab.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fill NAs in gdp_xts using linear approximation
gdp_approx <-
# Plot your new xts object
plot.xts(___, major.format = "%Y")
# Query for GDP in 1993 in gdp_approx