Schnüre trimmen
In der vorherigen Übung konntest du den richtigen Datentyp identifizieren und user_birth_year
in den richtigen Typ umwandeln, so dass du Zählungen extrahieren konntest, die dir einen besseren Einblick in den Datensatz gaben.
Ein weiteres häufiges Problem bei unsauberen Daten sind zusätzliche Bits wie Prozentzeichen oder Punkte in Zahlen, die dazu führen, dass sie als character
s eingelesen werden. Um diese Zahlen berechnen zu können, müssen die zusätzlichen Bits entfernt und die Zahlen von character
in numeric
umgewandelt werden. In dieser Übung musst du die Spalte duration
von character
in numeric
umwandeln, aber vorher muss das Wort "minutes"
aus jedem Wert entfernt werden.
dplyr
, assertive
und stringr
sind geladen und bike_share_rides
ist verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Anleitung zur Übung
- Benutze
str_remove()
, um"minutes"
aus der Spalteduration
vonbike_share_rides
zu entfernen. Füge dies als eine neue Spalte mit dem Namenduration_trimmed
hinzu. - Wandle die Spalte
duration_trimmed
in einen numerischen Typ um und füge sie als neue Spalte mit dem Namenduration_mins
hinzu. - Sieh dir
bike_share_rides
an und behaupte, dass die Spalteduration_mins
numeric
ist. - Berechne den Mittelwert von
duration_mins
.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
bike_share_rides <- bike_share_rides %>%
# Remove 'minutes' from duration: duration_trimmed
mutate(duration_trimmed = ___,
# Convert duration_trimmed to numeric: duration_mins
duration_mins = ___)
# Glimpse at bike_share_rides
___
# Assert duration_mins is numeric
___
# Calculate mean duration
___