LoslegenKostenlos loslegen

Fehlende Daten ersetzen – II

Wie bei den meisten Aspekten der Zeitreihenmanipulation gibt es viele Möglichkeiten, mit fehlenden Werten umzugehen. Wie du in der vorherigen Übung gesehen hast, erfordern sowohl der locf- als auch der nocb-Ansatz bestimmte Annahmen über Wachstumsmuster in deinen Daten. Während locf konservativer ist und nocb aggressiver, erzeugen beide stufenweises Wachstum aus fehlenden Werten.

Was aber, wenn du lineares Wachstum in deinen Daten erwartest? Dann ist lineare Interpolation sinnvoller. Dabei werden neue Werte zwischen den Daten an den Rändern des fehlenden Werts erzeugt und zeitlich gewichtet.

In dieser Übung füllst du die fehlenden Werte in deinen gdp_xts-Daten mit dem Befehl na.approx(), der per Interpolation lineare Werte über die Zeit schätzt.

Diese Übung ist Teil des Kurses

Fallstudie: Zeitreihendaten von Städten in R analysieren

Kurs anzeigen

Anleitung zur Übung

  • Verwende na.approx(), um die fehlenden Werte in gdp_xts mithilfe linearer Interpolation zu füllen. Speichere das neue xts-Objekt als gdp_approx.
  • Zeichne dein neues xts-Objekt mit plot.xts().
  • Frage in deinem neuen xts-Objekt das BIP für 1993 ab.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fill NAs in gdp_xts using linear approximation
gdp_approx <- 

# Plot your new xts object
plot.xts(___, major.format = "%Y")
  
# Query for GDP in 1993 in gdp_approx
Code bearbeiten und ausführen