LoslegenKostenlos loslegen

Histogramm zu KDE

In diesen Übungen betrachten wir einen Teil unseres Datensatzes mit Verwarnungen, die an "Heavy Duty Truck"s ausgegeben wurden. Stell dir vor, du bist ein datenaffiner Lkw-Fahrer und möchtest wissen, wann die gefährlichste Zeit ist, auf der Straße unterwegs zu sein. Beachte, dass der Stichprobenumfang hier nur 32 Beobachtungen umfasst.

Unten findest du Code, der mit ggplot ein Standard-Histogramm erstellt. Wenig überraschend ist es nicht besonders hilfreich. Es gibt nicht wirklich genug Daten, um sogar 30 Bins zu füllen – das macht es schwer zu lesen und zu verstehen. Wechsle die Geometrie zu einer KDE mit geom_density(). Füge schließlich, um maximale Transparenz zu gewährleisten, dem Plot eine Unterzeile hinzu, die den Betrachter über die verwendete Bandbreite deiner KDE informiert.

Diese Übung ist Teil des Kurses

Best Practices für Visualisierung in R

Kurs anzeigen

Anleitung zur Übung

  • Ändere die Histogramm-Geometrie in eine Dichte-Geometrie (geom_density()).
  • Setze die Standard-Bandbreite auf 1.5 Einheiten.
  • Füge deinem Plot das subtitle "Gaussian kernel SD = 1.5" hinzu, um die Bandbreite deines Kernels anzugeben.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# filter data to just heavy duty trucks
truck_speeding <- md_speeding %>% 
    filter(vehicle_type == "Heavy Duty Truck")
 
ggplot(truck_speeding, aes(x = hour_of_day)) +
    # switch to density with bin width of 1.5, keep fill 
    geom_histogram(fill = 'steelblue') +
    # add a subtitle stating binwidth
    labs(title = 'Citations by hour')
Code bearbeiten und ausführen