Zeitreihendiagramme
Der erste Schritt in jeder Datenanalyse ist es, die Daten zu visualisieren. Mit Diagrammen kannst du viele Eigenschaften der Daten sichtbar machen, darunter Muster, ungewöhnliche Beobachtungen, zeitliche Veränderungen und Beziehungen zwischen Variablen. Genau wie der Datentyp bestimmt, welche Forecasting-Methode eingesetzt wird, legt er auch fest, welche Diagramme geeignet sind.
Mit der Funktion autoplot() kannst du ein Zeitdiagramm der Daten erstellen – mit oder ohne Facets, also Panels, die verschiedene Teilmengen der Daten anzeigen:
> autoplot(usnim_2002, facets = FALSE)
Die oben gezeigte Methode ist eine von vielen in diesem Kurs, die boolesche Argumente akzeptieren. Sowohl T als auch TRUE bedeuten „wahr“, und F sowie FALSE bedeuten „falsch“. Allerdings können T und F in deinem Code überschrieben werden. Daher solltest du dich im weiteren Verlauf des Kurses ausschließlich auf TRUE und FALSE verlassen, um Indikatoren zu setzen.
In dieser Übung verwendest du außerdem zwei weitere Funktionen: which.max() und frequency().
Mit which.max() lässt sich der kleinste Index des Maximums ermitteln:
> x <- c(4, 5, 5)
> which.max(x)
[1] 2
Um die Anzahl der Beobachtungen pro Zeiteinheit zu finden, verwende frequency(). Erinnere dich an die usnim_2002-Daten aus der vorherigen Übung:
> frequency(usnim_2002)
[1] 4
Da dieser Kurs die Verwendung der Pakete forecast und ggplot2 umfasst, wurden sie – ebenso wie myts aus der vorherigen Übung – bereits für dich geladen. Außerdem stehen dir die folgenden drei Reihen (im Paket forecast verfügbar) zur Verfügung:
goldmit Goldpreisen in US-Dollarwoolyrnqmit Informationen zur Produktion von Wollgarn in Australiengasmit der australischen Gasproduktion
Diese Übung ist Teil des Kurses
Prognosen mit R
Anleitung zur Übung
- Plotte die als
mytsgespeicherten Daten mitautoplot()und mit Facets. - Plotte dieselben Daten ohne Facets, indem du das entsprechende Argument auf
FALSEsetzt. Was passiert? - Plotte die Zeitreihen
gold,woolyrnqundgasjeweils in separaten Plots. - Nutze
which.max(), um den Ausreißer in dergold-Reihe zu finden. Welche Beobachtung war es? - Wende
frequency()auf jede Reihe an, um die Anzahl der Beobachtungen pro Zeiteinheit zu erhalten. Für wöchentliche Daten wären das zum Beispiel 52.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plot the data with facetting
autoplot(___, facets = ___)
# Plot the data without facetting
___
# Plot the three series
autoplot(___)
___
___
# Find the outlier in the gold series
goldoutlier <- ___(___)
# Look at the seasonal frequencies of the three series
frequency(___)
___
___