Aan de slagGa gratis aan de slag

Binhoogte per context

De meegeleverde code bekijkt de verdeling van boetes per uur van de dag. Merk op dat de balken niet netjes op hele uren vallen; dat maakt het interpreteren van de balkhoogtes wat onhandig. Als je data natuurlijke grenspunten heeft zoals hier, moet je die benutten. In dit geval kunnen we de grenzen precies op de hele uren laten vallen.

Pas geom_histogram() aan om de binwidth op 1 uur te zetten. Dit argument vertelt ggplot echter niet waar het de bins moet starten; standaard wordt dat bepaald door het bereik van de data. Om dit te corrigeren, zet je het argument center op 0.5. Daarmee geef je aan dat je een van de balken wilt centreren op 30 minuten na middernacht; ggplot plaatst de overige balken vervolgens overeenkomstig. (Je kunt dit ook op elk uur + 0.5 zetten, zoals 2.5, 3.5, enz.)

Deze oefening maakt deel uit van de cursus

Best practices voor visualisaties in R

Cursus bekijken

Oefeninstructies

  • Zet de binwidth van de plot op 1.
  • Centreer de balken op het halve uur met het argument center.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

ggplot(md_speeding,aes(x = hour_of_day)) +
    geom_histogram(
        ___  # set binwidth to 1
        ___  # Center bins at the half (0.5) hour
    ) +
    scale_x_continuous(breaks = 0:24)
Code bewerken en uitvoeren