Beperkingen voor ritduur
Waarden buiten het bereik kunnen een analyse verstoren, dus het is belangrijk om ze vroegtijdig te vinden. In deze oefening bekijk je de kolom duration_min van dichterbij. Fietsen mogen niet langer dan 24 uur buiten blijven, ofwel maximaal 1440 minuten per rit, maar problemen met sommige fietsen zorgden voor een onjuiste registratie van het tijdstip waarop ze werden teruggebracht.
In deze oefening vervang je foutieve gegevens door de bovengrens van het bereik (1440 minuten). Je zou deze waarden echter ook kunnen vervangen door NA’s.
dplyr, assertive en ggplot2 zijn geladen en bike_share_rides is beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create breaks
breaks <- c(___, 0, 1440, ___)
# Create a histogram of duration_min
ggplot(___, aes(___)) +
___(breaks = ___)