Einschränkungen bei der Fahrtdauer
Werte, die außerhalb des zulässigen Bereichs liegen, können eine Analyse verfälschen, daher ist es wichtig, sie frühzeitig zu erkennen. In dieser Übung wirst du dir die Spalte duration_min
genauer ansehen. Die Fahrräder dürfen nicht länger als 24 Stunden oder 1440 Minuten am Stück abgestellt werden, aber bei einigen Fahrrädern gab es Probleme mit der Aufzeichnung der Rückgabezeit.
In dieser Übung ersetzt du die fehlerhaften Daten durch die Bereichsgrenze (1440 Minuten), du könntest diese Werte aber genauso gut durch NA
s ersetzen.
dplyr
, assertive
und ggplot2
sind geladen und bike_share_rides
ist verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create breaks
breaks <- c(___, 0, 1440, ___)
# Create a histogram of duration_min
ggplot(___, aes(___)) +
___(breaks = ___)