1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Forecasting v R

Connected

cvičení

Grafy časových řad

První krok každé datové analýzy je vizualizace dat. Grafy ti umožní odhalit mnoho vlastností dat – vzory, neobvyklé hodnoty, změny v čase i vztahy mezi proměnnými. Stejně jako typ dat určuje, kterou metodu předpovídání použít, určuje také, jaký typ grafu je vhodný.

Pro vytvoření časového grafu dat s panely nebo bez nich můžeš použít funkci autoplot():

> autoplot(usnim_2002, facets = FALSE)

Tato metoda – stejně jako mnohé další v tomto kurzu – přijímá logické argumenty. Hodnoty T i TRUE znamenají „pravda" a F i FALSE znamenají „nepravda". Jenže T a F lze v kódu přepsat, proto se ve zbytku kurzu spolehni výhradně na TRUE a FALSE.

V tomto cvičení využiješ ještě dvě funkce: which.max() a frequency(). which.max() vrátí nejmenší index maximální hodnoty:

> x <- c(4, 5, 5)
> which.max(x)
[1] 2

Počet pozorování za jednotku času zjistíš pomocí frequency(). Vzpomeň si na data usnim_2002 z předchozího cvičení:

> frequency(usnim_2002)
[1] 4

Protože kurz pracuje s balíčky forecast a ggplot2, jsou už načteny do tvého pracovního prostředí. Stejně tak je k dispozici myts z předchozího cvičení a tyto tři řady (dostupné v balíčku forecast):

  • gold – ceny zlata v amerických dolarech
  • woolyrnq – data o produkci vlněné příze v Austrálii
  • gas – australská produkce plynu

Pokyny

100 XP
  • Vykresli data uložená jako myts pomocí funkce autoplot() s použitím panelů (facetting).
  • Vykresli stejná data bez panelů – nastav příslušný argument na FALSE. Co se změní?
  • Vykresli časové řady gold, woolyrnq a gas jako samostatné grafy.
  • Pomocí which.max() najdi odlehlou hodnotu v řadě gold. O které pozorování jde?
  • Aplikuj funkci frequency() na každou komoditu a zjisti počet pozorování za jednotku času – například pro týdenní data by výsledek byl 52.