1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza szeregów czasowych w R

Connected

ćwiczenie

Brakujące wartości

W danych szeregów czasowych czasami pojawiają się brakujące wartości, oznaczane w R jako NA. Warto wiedzieć, gdzie się znajdują i jak poszczególne funkcje R sobie z nimi radzą. Niekiedy brakujące wartości można zignorować, innym razem lepiej je uzupełnić – czyli dokonać imputacji.

Wróćmy do miesięcznego zbioru danych AirPassengers, ale tym razem dane z roku 1956 są niedostępne. W tym ćwiczeniu sprawdzisz, jak te braki wpływają na analizę, i uzupełnisz brakujące obserwacje.

Funkcja mean() oblicza średnią próbki, ale zwróci NA, jeśli dane zawierają choćby jedną brakującą wartość. Użyj mean(___, na.rm = TRUE), aby obliczyć średnią z pominięciem wartości NA. Zastępowanie brakujących danych średnią obserwowanych wartości to popularna technika imputacji. Zastanów się, czy ta prosta metoda sprawdza się w przypadku zbioru AirPassengers.

Instrukcje

100 XP
  • Użyj funkcji plot(), aby wyświetlić wykres danych AirPassengers. Zwróć uwagę na brak danych za rok 1956.
  • Użyj funkcji mean(), aby obliczyć średnią próbki dla AirPassengers z pominięciem brakujących wartości (na.rm = TRUE).
  • Uruchom gotowy kod, który uzupełni brakujące dane wartością średniej.
  • Wywołaj ponownie funkcję plot(), aby wyświetlić wykres zaktualizowanego zbioru AirPassengers.
  • Uruchom gotowy kod, który doda do wykresu kompletne dane AirPassengers.