Histogramm zu KDE
In diesen Übungen betrachten wir einen Teil unseres Datensatzes mit Verwarnungen, die an "Heavy Duty Truck"s ausgegeben wurden. Stell dir vor, du bist ein datenaffiner Lkw-Fahrer und möchtest wissen, wann die gefährlichste Zeit ist, auf der Straße unterwegs zu sein. Beachte, dass der Stichprobenumfang hier nur 32 Beobachtungen umfasst.
Unten findest du Code, der mit ggplot ein Standard-Histogramm erstellt. Wenig überraschend ist es nicht besonders hilfreich. Es gibt nicht wirklich genug Daten, um sogar 30 Bins zu füllen – das macht es schwer zu lesen und zu verstehen. Wechsle die Geometrie zu einer KDE mit geom_density(). Füge schließlich, um maximale Transparenz zu gewährleisten, dem Plot eine Unterzeile hinzu, die den Betrachter über die verwendete Bandbreite deiner KDE informiert.
Diese Übung ist Teil des Kurses
Best Practices für Visualisierung in R
Anleitung zur Übung
- Ändere die Histogramm-Geometrie in eine Dichte-Geometrie (
geom_density()). - Setze die Standard-Bandbreite auf
1.5Einheiten. - Füge deinem Plot das
subtitle"Gaussian kernel SD = 1.5"hinzu, um die Bandbreite deines Kernels anzugeben.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>%
filter(vehicle_type == "Heavy Duty Truck")
ggplot(truck_speeding, aes(x = hour_of_day)) +
# switch to density with bin width of 1.5, keep fill
geom_histogram(fill = 'steelblue') +
# add a subtitle stating binwidth
labs(title = 'Citations by hour')