IniziaInizia gratis

Larghezza dei bin in base al contesto

Il codice fornito analizza la distribuzione delle multe per ora del giorno. Nota come le barre non si allineano bene su un’ora precisa; questo rende un po’ scomoda l’interpretazione dell’altezza delle barre. Quando i tuoi dati hanno punti di discontinuità naturali come questi, conviene sfruttarli. In questo caso possiamo impostare le suddivisioni in corrispondenza dei confini delle ore.

Modifica geom_histogram() per impostare binwidth a 1 ora. Questo argomento, però, non dice a ggplot da dove iniziare i bin, che di default è determinato dall’estensione dei dati. Per risolvere, imposta l’argomento center a 0.5. In questo modo chiedi che una delle barre sia centrata a 30 minuti dopo la mezzanotte; ggplot disporrà poi di conseguenza le altre barre. (Puoi impostarlo a qualsiasi ora + 0.5, ad esempio 2.5, 3.5, ecc.)

Questo esercizio fa parte del corso

Buone pratiche di visualizzazione in R

Visualizza il corso

Istruzioni dell'esercizio

  • Imposta il binwidth del grafico a 1.
  • Centra le barre sulla mezz’ora con l’argomento center.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

ggplot(md_speeding,aes(x = hour_of_day)) +
    geom_histogram(
        ___  # set binwidth to 1
        ___  # Center bins at the half (0.5) hour
    ) +
    scale_x_continuous(breaks = 0:24)
Modifica ed esegui il codice