KDE mit vielen Daten
Der bereitgestellte Code erstellt eine einfache KDE der percentage_over_limit für alle Verwarnungen. Auf den ersten Blick wirken die Einstellungen sinnvoll. Wir haben viele Daten, also wählen wir eine schön schmale Klassenbreite: nur ein Prozent. Außerdem hat das sorgfältig hinzugefügte Rug-Plot eine reduzierte Alpha-Transparenz von 0.7.
Wenn du den Code ausführst, siehst du sofort: Das ist kein guter Plot. Die Dichteschätzung sieht aus wie ein Stachelschwein, und das Rug-Plot ist durch die massive Überlagerung im Grunde ein dicker schwarzer Balken.
Beheb das, indem du die Klassenbreite etwas erhöhst auf 2.5 und die alpha des Rug-Plots auf 0.05 senkst, um ein Gefühl für die Punktüberlagerung zu bekommen. Vergiss nicht, den Untertitel zu ändern, damit die neue Kernel-Breite klar wird!
Diese Übung ist Teil des Kurses
Best Practices für Visualisierung in R
Anleitung zur Übung
- Kernel-SD auf
2.5ändern alphades Rug-Plots auf0.05setzen- Den
subtitleauf"Gaussian kernel SD = 2.5"ändern, um die neue Kernel-Breite widerzuspiegeln.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
ggplot(md_speeding, aes(x = percentage_over_limit)) +
# Increase bin width to 2.5
geom_density(fill = 'steelblue', bw = 1, alpha = 0.7) +
# lower rugplot alpha to 0.05
geom_rug(alpha = 0.5) +
labs(
title = 'Distribution of % over speed limit',
# modify subtitle to reflect change in kernel width
subtitle = "Gaussian kernel SD = 1"
)