Aan de slagGa gratis aan de slag

Tijdreeksplots

De eerste stap bij elke data-analyse is het visualiseren van de data. Grafieken helpen je veel kenmerken van de data te zien, zoals patronen, uitschieters, veranderingen in de tijd en relaties tussen variabelen. Net zoals het type data bepaalt welke forecasting-methode je gebruikt, bepaalt het ook welke grafieken geschikt zijn.

Je kunt de functie autoplot() gebruiken om een tijdplot van de data te maken, met of zonder facets, oftewel panelen die verschillende subsets van de data tonen:

> autoplot(usnim_2002, facets = FALSE)

De bovenstaande methode is een van de vele in deze cursus die booleaanse argumenten accepteert. Zowel T als TRUE betekenen "waar", en F en FALSE betekenen "onwaar". Let wel: T en F kunnen in je code worden overschreven. Daarom moet je in de rest van de cursus alleen vertrouwen op TRUE en FALSE om je indicatoren te zetten.

Je gebruikt in deze oefening nog twee functies: which.max() en frequency().
Met which.max() kun je de kleinste index van de maximumwaarde bepalen

> x <- c(4, 5, 5)
> which.max(x)
[1] 2

Om het aantal observaties per tijdseenheid te vinden, gebruik je frequency(). Denk aan de usnim_2002-data uit de vorige oefening:

> frequency(usnim_2002)
[1] 4

Omdat je in deze cursus de pakketten forecast en ggplot2 gebruikt, zijn die alvast voor je geladen, net als myts uit de vorige oefening en de volgende drie reeksen (beschikbaar in het pakket forecast):

  • gold met goudprijzen in Amerikaanse dollars
  • woolyrnq met informatie over de productie van wollen garen in Australië
  • gas met Australische gasproductie

Deze oefening maakt deel uit van de cursus

Voorspellen in R

Cursus bekijken

Oefeninstructies

  • Plot de data die je als myts hebt opgeslagen met autoplot() met facets.
  • Plot dezelfde data zonder facets door het juiste argument op FALSE te zetten. Wat gebeurt er?
  • Plot de tijdreeksen gold, woolyrnq en gas in aparte plots.
  • Gebruik which.max() om de uitschieter in de gold-reeks te vinden. Welke observatie was dat?
  • Pas de functie frequency() toe op elk product om het aantal observaties per tijdseenheid te krijgen. Voor wekelijkse data zou dit bijvoorbeeld 52 teruggeven.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot the data with facetting
autoplot(___, facets = ___)

# Plot the data without facetting
___

# Plot the three series
autoplot(___)
___
___

# Find the outlier in the gold series
goldoutlier <- ___(___)

# Look at the seasonal frequencies of the three series
frequency(___)
___
___
Code bewerken en uitvoeren