Larghezza dei bin in base al contesto
Il codice fornito analizza la distribuzione delle multe per ora del giorno. Nota come le barre non si allineano bene su un’ora precisa; questo rende un po’ scomoda l’interpretazione dell’altezza delle barre. Quando i tuoi dati hanno punti di discontinuità naturali come questi, conviene sfruttarli. In questo caso possiamo impostare le suddivisioni in corrispondenza dei confini delle ore.
Modifica geom_histogram() per impostare binwidth a 1 ora. Questo argomento, però, non dice a ggplot da dove iniziare i bin, che di default è determinato dall’estensione dei dati. Per risolvere, imposta l’argomento center a 0.5. In questo modo chiedi che una delle barre sia centrata a 30 minuti dopo la mezzanotte; ggplot disporrà poi di conseguenza le altre barre. (Puoi impostarlo a qualsiasi ora + 0.5, ad esempio 2.5, 3.5, ecc.)
Questo esercizio fa parte del corso
Buone pratiche di visualizzazione in R
Istruzioni dell'esercizio
- Imposta il
binwidthdel grafico a 1. - Centra le barre sulla mezz’ora con l’argomento
center.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
ggplot(md_speeding,aes(x = hour_of_day)) +
geom_histogram(
___ # set binwidth to 1
___ # Center bins at the half (0.5) hour
) +
scale_x_continuous(breaks = 0:24)