1. Nauka
  2. /
  3. Kursy
  4. /
  5. Prognozowanie w R

Connected

ćwiczenie

Wykresy szeregów czasowych

Pierwszym krokiem w każdej analizie danych jest wizualizacja. Wykresy pozwalają dostrzec wiele cech danych: wzorce, nietypowe obserwacje, zmiany w czasie i zależności między zmiennymi. Podobnie jak typ danych decyduje o wyborze metody prognozowania, determinuje również dobór odpowiednich wykresów.

Do tworzenia wykresu czasowego danych służy funkcja autoplot() – z podziałem na panele lub bez:

> autoplot(usnim_2002, facets = FALSE)

Powyższa metoda, podobnie jak wiele innych omawianych w tym kursie, przyjmuje argumenty logiczne. Zarówno T, jak i TRUE oznaczają „prawda", a F i FALSE oznaczają „fałsz" – jednak T i F można nadpisać w kodzie. Dlatego przez cały kurs używaj wyłącznie TRUE i FALSE do ustawiania wskaźników logicznych.

W tym ćwiczeniu skorzystasz z dwóch dodatkowych funkcji: which.max() i frequency(). which.max() zwraca najmniejszy indeks maksymalnej wartości:

> x <- c(4, 5, 5)
> which.max(x)
[1] 2

Aby sprawdzić liczbę obserwacji na jednostkę czasu, użyj funkcji frequency(). Przypomnij sobie dane usnim_2002 z poprzedniego ćwiczenia:

> frequency(usnim_2002)
[1] 4

Ponieważ kurs wykorzystuje pakiety forecast i ggplot2, zostały one już wczytane do twojego środowiska pracy. Dostępne są również myts z poprzedniego ćwiczenia oraz trzy poniższe szeregi (z pakietu forecast):

  • gold – ceny złota w dolarach amerykańskich
  • woolyrnq – dane o produkcji przędzy wełnianej w Australii
  • gas – dane o produkcji gazu w Australii

Instrukcje

100 XP
  • Narysuj wykres danych zapisanych jako myts za pomocą autoplot() z podziałem na panele.
  • Narysuj te same dane bez podziału na panele, ustawiając odpowiedni argument na FALSE. Co się zmieniło?
  • Narysuj szeregi czasowe gold, woolyrnq i gas na osobnych wykresach.
  • Użyj funkcji which.max(), aby znaleźć wartość odstającą w szeregu gold. Która to obserwacja?
  • Zastosuj funkcję frequency() do każdego z szeregów, aby sprawdzić liczbę obserwacji na jednostkę czasu. Na przykład dla danych tygodniowych wynik wyniesie 52.