Meer balken
Met de laatste plot lijken 40 bins ongeveer te suggereren dat we een scheve maar unimodale verdeling hebben. Denk aan de vuistregel uit de dia's: als je meer dan 150 datapunten hebt, kun je meestal direct naar 100 bins gaan. Laten we dat hier doen.
Bewerk de plot zodat deze 100 bins heeft in plaats van 40 en verander ook de kleur van de balken naar 'steelblue', gewoon omdat het een goede kleur is en dat soms belangrijk is.
Valt je nu iets op aan het bereik rond 30%? Als je iets meer gevoel wilt krijgen voor wat er kan gebeuren, probeer dan de gegevens te filteren op het percentage boven de snelheidslimiet van 30.
md_speeding %>% filter(percentage_over_limit == 30)
Zie je iets verrassends voor een continue waarde?
Deze oefening maakt deel uit van de cursus
Best practices voor visualisaties in R
Oefeninstructies
- Verander het aantal bins naar 100
- Zet de
fillvan de balken op'steelblue'
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
ggplot(md_speeding) +
geom_histogram(
aes(x = percentage_over_limit),
bins = 40 , # switch to 100 bins
___ # set the fill of the bars to 'steelblue'
alpha = 0.8 )