Vincoli sulla durata delle corse
I valori fuori dall'intervallo possono falsare un'analisi, quindi è importante individuarli subito. In questo esercizio esaminerai più da vicino la colonna duration_min. Le bici non possono essere tenute fuori per più di 24 ore, cioè 1440 minuti alla volta, ma problemi con alcune bici hanno causato una registrazione imprecisa dell'orario di riconsegna.
In questo esercizio sostituirai i dati errati con il limite dell'intervallo (1440 minuti); in alternativa, potresti anche sostituire questi valori con NA.
dplyr, assertive e ggplot2 sono caricati e bike_share_rides è disponibile.
Questo esercizio fa parte del corso
Pulizia dei dati in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create breaks
breaks <- c(___, 0, 1440, ___)
# Create a histogram of duration_min
ggplot(___, aes(___)) +
___(breaks = ___)