Tijdreeksplots
De eerste stap bij elke data-analyse is het visualiseren van de data. Grafieken helpen je veel kenmerken van de data te zien, zoals patronen, uitschieters, veranderingen in de tijd en relaties tussen variabelen. Net zoals het type data bepaalt welke forecasting-methode je gebruikt, bepaalt het ook welke grafieken geschikt zijn.
Je kunt de functie autoplot() gebruiken om een tijdplot van de data te maken, met of zonder facets, oftewel panelen die verschillende subsets van de data tonen:
> autoplot(usnim_2002, facets = FALSE)
De bovenstaande methode is een van de vele in deze cursus die booleaanse argumenten accepteert. Zowel T als TRUE betekenen "waar", en F en FALSE betekenen "onwaar". Let wel: T en F kunnen in je code worden overschreven. Daarom moet je in de rest van de cursus alleen vertrouwen op TRUE en FALSE om je indicatoren te zetten.
Je gebruikt in deze oefening nog twee functies: which.max() en frequency().
Met which.max() kun je de kleinste index van de maximumwaarde bepalen
> x <- c(4, 5, 5)
> which.max(x)
[1] 2
Om het aantal observaties per tijdseenheid te vinden, gebruik je frequency(). Denk aan de usnim_2002-data uit de vorige oefening:
> frequency(usnim_2002)
[1] 4
Omdat je in deze cursus de pakketten forecast en ggplot2 gebruikt, zijn die alvast voor je geladen, net als myts uit de vorige oefening en de volgende drie reeksen (beschikbaar in het pakket forecast):
goldmet goudprijzen in Amerikaanse dollarswoolyrnqmet informatie over de productie van wollen garen in Australiëgasmet Australische gasproductie
Deze oefening maakt deel uit van de cursus
Voorspellen in R
Oefeninstructies
- Plot de data die je als
mytshebt opgeslagen metautoplot()met facets. - Plot dezelfde data zonder facets door het juiste argument op
FALSEte zetten. Wat gebeurt er? - Plot de tijdreeksen
gold,woolyrnqengasin aparte plots. - Gebruik
which.max()om de uitschieter in degold-reeks te vinden. Welke observatie was dat? - Pas de functie
frequency()toe op elk product om het aantal observaties per tijdseenheid te krijgen. Voor wekelijkse data zou dit bijvoorbeeld 52 teruggeven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot the data with facetting
autoplot(___, facets = ___)
# Plot the data without facetting
___
# Plot the three series
autoplot(___)
___
___
# Find the outlier in the gold series
goldoutlier <- ___(___)
# Look at the seasonal frequencies of the three series
frequency(___)
___
___