Kodieren und Plotten von Red-Sox-Daten
Nach der Analyse und Aufbereitung von Daten zu Flügen, Wetter und Wirtschaft will dein Kunde jetzt wirklich alle Bereiche abdecken. Daher sollst du Daten zu den großen Sportteams in Boston sammeln: den Boston Red Sox (Baseball), den New England Patriots (Football), den Boston Bruins (Eishockey) und den Boston Celtics (Basketball). In diesem Kapitel bereitest du Daten zum Spielplan und den Ergebnissen aller Spiele dieser Teams von 2010 bis 2015 auf. Das ist eine perfekte Gelegenheit, weiter mit Zeitreihendaten zu arbeiten!
Zum Einstieg hast du Daten zu Spielen der Boston Red Sox von 2010 bis 2015 zusammengestellt. In dieser Übung wirst du die Daten erkunden, sie in xts kodieren und einige Trends über die Zeit hinweg visualisieren. Der Data Frame redsox steht dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Fallstudie: Zeitreihendaten von Städten in R analysieren
Anleitung zur Übung
- Nutze
summary(), um dir einige zusammenfassende Statistiken zu deinenredsox-Daten anzusehen. Achte dabei auf die Datumsspalte und prüfe, ob es fehlende Werte (NAs) gibt, die du behandeln musst. - Wenn du sicher bist, dass sich die
redsox-Daten nach xts konvertieren lassen, beginne damit, die Spaltedatemitas.Date()in ein zeitbasiertes Objekt zu konvertieren. - Verwende
as.xts(), um deineredsox-Daten in xts zu konvertieren, und gib beiorder.bydie Spaltedatean. Entferne außerdem die Datumsspalte (mit der Notation[, -1]), damit dein xts-Objekt numerisch ist. - Nutze
plot.zoo(), um die Red-Sox-Punkte (boston_score) und die Punkte der Gegner (opponent_score) über die Zeit zu plotten. Welche Trends erkennst du in diesen Plots?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# View summary information about your redsox data
# Convert the date column to a time-based format
redsox$date <- as.Date(___$___)
# Convert your red sox data to xts
redsox_xts <- as.xts(___[,-1], order.by = ___$___)
# Plot the Red Sox score and the opponent score over time
plot.zoo(___[, c("___", "___")])