Extrahieren fürs Plotten
Das Extrahieren von Komponenten aus einem Datum-Uhrzeit-Wert ist besonders nützlich, wenn du Daten untersuchst. Früher in diesem Kapitel hast du tägliche Wetterdaten für Auckland importiert und eine Zeitreihengrafik über zehn Jahre der täglichen Höchsttemperatur erstellt. Diese Grafik gibt dir zwar einen guten Überblick über die gesamten zehn Jahre, aber das jährliche Muster ist schwer zu erkennen.
In dieser Übung nutzt du Datumsbestandteile, um das Muster der Höchsttemperatur über das Jahr hinweg zu untersuchen. Der erste Schritt ist, neue Spalten anzulegen, um die extrahierten Teile zu speichern. Danach verwendest du sie in ein paar Grafiken.
Diese Übung ist Teil des Kurses
Arbeiten mit Datums- und Zeitangaben in R
Anleitung zur Übung
- Verwende
mutate(), um drei neue Spalten zu erstellen:year,ydayundmonth, die jeweils die entsprechenden Komponenten der Spaltedateenthalten. Vergiss nicht, die Monate mit ihren Namen zu beschriften. - Erstelle eine Grafik mit
ydayauf der x-Achse,max_tempauf der y-Achse, wobei die Linien nachyeargruppiert werden. Jedes Jahr ist in diesem Plot eine Linie, die x-Achse verläuft von 1. Jan. bis 31. Dez. - Für eine alternative Darstellung erstelle einen Ridgeline-Plot (früher Joyplot genannt) mit
max_tempauf der x-Achse,monthauf der y-Achse, und nutzegeom_density_ridges()aus dem Paketggridges.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
library(ggplot2)
library(dplyr)
library(ggridges)
# Add columns for year, yday and month
akl_daily <- akl_daily %>%
mutate(
___ = ___(date),
___ = ___(date),
___ = ___(date, ___))
# Plot max_temp by yday for all years
ggplot(akl_daily, aes(x = ___, y = ___)) +
geom_line(aes(group = ___), alpha = 0.5)
# Examine distribution of max_temp by month
ggplot(akl_daily, aes(x = ___, y = ___, height = ..density..)) +
geom_density_ridges(stat = "density")