1. Nauka
  2. /
  3. Projekty
  4. /
  5. Studium przypadku: analiza danych szeregów czasowych miasta w R

Connected

ćwiczenie

Zastępowanie brakujących danych – cz. I

Jak wykazało poprzednie ćwiczenie, w kwartalnych danych PKB brakuje kilku obserwacji. Wywołanie summary() ujawniło aż 80 brakujących punktów danych!

Jak zapewne pamiętasz z pierwszego kursu poświęconego xts, pakiety xts i zoo oferują różne funkcje do obsługi brakujących danych.

Najprostszą techniką jest polecenie na.locf(), które przenosi w przód ostatnią obserwację poprzedzającą brakujące dane (stąd nazwa: „last observation carried forward", czyli locf). To podejście jest często najbardziej odpowiednie do obsługi braków danych – szczególnie gdy chcesz zachować ostrożność w kwestii wzrostu wartości.

Podobna technika działa w przeciwnym kierunku: pobiera pierwszą obserwację po brakującej wartości i przenosi ją wstecz („next observation carried backward", czyli nocb). Tę metodę również można zastosować za pomocą polecenia na.locf(), ustawiając argument fromLast na TRUE.

Wybór metody zależy od rodzaju danych, z którymi pracujesz, oraz od tego, jak według ciebie zmieniają się one w czasie.

Instrukcje

100 XP
  • Użyj na.locf(), aby uzupełnić brakujące wartości w gdp_xts na podstawie ostatniej obserwacji przenoszonej w przód. Zapisz nowy obiekt xts jako gdp_locf.
  • Wywołaj ponownie na.locf(), aby uzupełnić brakujące wartości w gdp_xts na podstawie następnej obserwacji przenoszonej wstecz. W tym celu ustaw argument fromLast na TRUE. Zapisz nowy obiekt xts jako gdp_nocb.
  • Wykreśl oba obiekty za pomocą plot.xts(). Skorzystaj z gotowego polecenia par(), aby wyświetlić oba wykresy obok siebie.
  • Odpytaj każdy obiekt (gdp_locf i gdp_nocb) o wartość PKB w 1993 roku.