Schnüre trimmen
In der vorherigen Übung konntest du den richtigen Datentyp identifizieren und user_birth_year in den richtigen Typ umwandeln, so dass du Zählungen extrahieren konntest, die dir einen besseren Einblick in den Datensatz gaben.
Ein weiteres häufiges Problem bei unsauberen Daten sind zusätzliche Bits wie Prozentzeichen oder Punkte in Zahlen, die dazu führen, dass sie als characters eingelesen werden. Um diese Zahlen berechnen zu können, müssen die zusätzlichen Bits entfernt und die Zahlen von character in numeric umgewandelt werden. In dieser Übung musst du die Spalte duration von character in numeric umwandeln, aber vorher muss das Wort "minutes" aus jedem Wert entfernt werden.
dplyr, assertive und stringr sind geladen und bike_share_rides ist verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Anleitung zur Übung
- Benutze
str_remove(), um"minutes"aus der Spaltedurationvonbike_share_rideszu entfernen. Füge dies als eine neue Spalte mit dem Namenduration_trimmedhinzu. - Wandle die Spalte
duration_trimmedin einen numerischen Typ um und füge sie als neue Spalte mit dem Namenduration_minshinzu. - Sieh dir
bike_share_ridesan und behaupte, dass die Spalteduration_minsnumericist. - Berechne den Mittelwert von
duration_mins.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
bike_share_rides <- bike_share_rides %>%
# Remove 'minutes' from duration: duration_trimmed
mutate(duration_trimmed = ___,
# Convert duration_trimmed to numeric: duration_mins
duration_mins = ___)
# Glimpse at bike_share_rides
___
# Assert duration_mins is numeric
___
# Calculate mean duration
___