LoslegenKostenlos loslegen

KDE mit vielen Daten

Der bereitgestellte Code erstellt eine einfache KDE der percentage_over_limit für alle Verwarnungen. Auf den ersten Blick wirken die Einstellungen sinnvoll. Wir haben viele Daten, also wählen wir eine schön schmale Klassenbreite: nur ein Prozent. Außerdem hat das sorgfältig hinzugefügte Rug-Plot eine reduzierte Alpha-Transparenz von 0.7.

Wenn du den Code ausführst, siehst du sofort: Das ist kein guter Plot. Die Dichteschätzung sieht aus wie ein Stachelschwein, und das Rug-Plot ist durch die massive Überlagerung im Grunde ein dicker schwarzer Balken.

Beheb das, indem du die Klassenbreite etwas erhöhst auf 2.5 und die alpha des Rug-Plots auf 0.05 senkst, um ein Gefühl für die Punktüberlagerung zu bekommen. Vergiss nicht, den Untertitel zu ändern, damit die neue Kernel-Breite klar wird!

Diese Übung ist Teil des Kurses

Best Practices für Visualisierung in R

Kurs anzeigen

Anleitung zur Übung

  • Kernel-SD auf 2.5 ändern
  • alpha des Rug-Plots auf 0.05 setzen
  • Den subtitle auf "Gaussian kernel SD = 2.5" ändern, um die neue Kernel-Breite widerzuspiegeln.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

ggplot(md_speeding, aes(x = percentage_over_limit)) +
    # Increase bin width to 2.5
    geom_density(fill = 'steelblue', bw = 1,  alpha = 0.7) + 
    # lower rugplot alpha to 0.05
    geom_rug(alpha = 0.5) + 
    labs(
        title = 'Distribution of % over speed limit', 
        # modify subtitle to reflect change in kernel width
        subtitle = "Gaussian kernel SD = 1"
    )
Code bearbeiten und ausführen