LoslegenKostenlos loslegen

Zeitreihendiagramme

Der erste Schritt in jeder Datenanalyse ist es, die Daten zu visualisieren. Mit Diagrammen kannst du viele Eigenschaften der Daten sichtbar machen, darunter Muster, ungewöhnliche Beobachtungen, zeitliche Veränderungen und Beziehungen zwischen Variablen. Genau wie der Datentyp bestimmt, welche Forecasting-Methode eingesetzt wird, legt er auch fest, welche Diagramme geeignet sind.

Mit der Funktion autoplot() kannst du ein Zeitdiagramm der Daten erstellen – mit oder ohne Facets, also Panels, die verschiedene Teilmengen der Daten anzeigen:

> autoplot(usnim_2002, facets = FALSE)

Die oben gezeigte Methode ist eine von vielen in diesem Kurs, die boolesche Argumente akzeptieren. Sowohl T als auch TRUE bedeuten „wahr“, und F sowie FALSE bedeuten „falsch“. Allerdings können T und F in deinem Code überschrieben werden. Daher solltest du dich im weiteren Verlauf des Kurses ausschließlich auf TRUE und FALSE verlassen, um Indikatoren zu setzen.

In dieser Übung verwendest du außerdem zwei weitere Funktionen: which.max() und frequency().
Mit which.max() lässt sich der kleinste Index des Maximums ermitteln:

> x <- c(4, 5, 5)
> which.max(x)
[1] 2

Um die Anzahl der Beobachtungen pro Zeiteinheit zu finden, verwende frequency(). Erinnere dich an die usnim_2002-Daten aus der vorherigen Übung:

> frequency(usnim_2002)
[1] 4

Da dieser Kurs die Verwendung der Pakete forecast und ggplot2 umfasst, wurden sie – ebenso wie myts aus der vorherigen Übung – bereits für dich geladen. Außerdem stehen dir die folgenden drei Reihen (im Paket forecast verfügbar) zur Verfügung:

  • gold mit Goldpreisen in US-Dollar
  • woolyrnq mit Informationen zur Produktion von Wollgarn in Australien
  • gas mit der australischen Gasproduktion

Diese Übung ist Teil des Kurses

Prognosen mit R

Kurs anzeigen

Anleitung zur Übung

  • Plotte die als myts gespeicherten Daten mit autoplot() und mit Facets.
  • Plotte dieselben Daten ohne Facets, indem du das entsprechende Argument auf FALSE setzt. Was passiert?
  • Plotte die Zeitreihen gold, woolyrnq und gas jeweils in separaten Plots.
  • Nutze which.max(), um den Ausreißer in der gold-Reihe zu finden. Welche Beobachtung war es?
  • Wende frequency() auf jede Reihe an, um die Anzahl der Beobachtungen pro Zeiteinheit zu erhalten. Für wöchentliche Daten wären das zum Beispiel 52.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Plot the data with facetting
autoplot(___, facets = ___)

# Plot the data without facetting
___

# Plot the three series
autoplot(___)
___
___

# Find the outlier in the gold series
goldoutlier <- ___(___)

# Look at the seasonal frequencies of the three series
frequency(___)
___
___
Code bearbeiten und ausführen