Mehr Balken
Mit dem letzten Plot sehen 40 Bins so aus, als hätten wir eine schiefe, aber unimodale Verteilung. Erinnerst du dich an die Faustregel aus den Folien: Wenn du mehr als 150 Datenpunkte hast, solltest du in der Regel direkt auf 100 Bins gehen. Das machen wir hier.
Bearbeite den Plot so, dass er 100 statt 40 Bins hat, und ändere außerdem die Farbe der Balken auf 'steelblue' – einfach, weil es eine gute Farbe ist und das manchmal wichtig ist.
Fällt dir jetzt etwas im Bereich um 30 % auf? Wenn du eine bessere Vorstellung davon bekommen willst, was passieren könnte, filtere die Daten auf den Prozentsatz über dem Tempolimit von 30.
md_speeding %>% filter(percentage_over_limit == 30)
Siehst du etwas Überraschendes für einen kontinuierlichen Wert?
Diese Übung ist Teil des Kurses
Best Practices für Visualisierung in R
Anleitung zur Übung
- Anzahl der Bins auf 100 ändern
fillder Balken auf'steelblue'setzen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
ggplot(md_speeding) +
geom_histogram(
aes(x = percentage_over_limit),
bins = 40 , # switch to 100 bins
___ # set the fill of the bars to 'steelblue'
alpha = 0.8 )