1. Nauka
  2. /
  3. Projekty
  4. /
  5. Studium przypadku: analiza danych szeregów czasowych miasta w R

Connected

ćwiczenie

Zastępowanie brakujących danych – II

Podobnie jak w wielu innych aspektach pracy z danymi szeregów czasowych, brakujące wartości można obsługiwać na różne sposoby. Jak przekonałeś się w poprzednim ćwiczeniu, zarówno podejście locf, jak i nocb wymagają przyjęcia pewnych założeń dotyczących wzorców wzrostu w danych. locf jest bardziej zachowawcze, nocb – bardziej agresywne, ale oba generują schodkowy wzrost w miejscach brakujących wartości.

Co jednak zrobić, jeśli masz powody sądzić, że dane rosną liniowo? W takim przypadku lepszym rozwiązaniem może być interpolacja liniowa, która generuje nowe wartości pomiędzy danymi po obu stronach brakującej wartości, ważone według czasu.

W tym ćwiczeniu uzupełnisz brakujące wartości w zbiorze danych gdp_xts za pomocą polecenia na.approx(), które szacuje wartości liniowe w czasie metodą interpolacji.

Instrukcje

100 XP
  • Użyj na.approx(), aby uzupełnić brakujące wartości w gdp_xts metodą interpolacji liniowej. Zapisz nowy obiekt xts jako gdp_approx.
  • Wykreśl nowy obiekt xts za pomocą plot.xts().
  • Zapytaj nowy obiekt xts o wartości PKB z 1993 roku.