LoslegenKostenlos loslegen

Schnüre trimmen

In der vorherigen Übung konntest du den richtigen Datentyp identifizieren und user_birth_year in den richtigen Typ umwandeln, so dass du Zählungen extrahieren konntest, die dir einen besseren Einblick in den Datensatz gaben.

Ein weiteres häufiges Problem bei unsauberen Daten sind zusätzliche Bits wie Prozentzeichen oder Punkte in Zahlen, die dazu führen, dass sie als characters eingelesen werden. Um diese Zahlen berechnen zu können, müssen die zusätzlichen Bits entfernt und die Zahlen von character in numeric umgewandelt werden. In dieser Übung musst du die Spalte duration von character in numeric umwandeln, aber vorher muss das Wort "minutes" aus jedem Wert entfernt werden.

dplyr, assertive und stringr sind geladen und bike_share_rides ist verfügbar.

Diese Übung ist Teil des Kurses

Daten in R bereinigen

Kurs anzeigen

Anleitung zur Übung

  • Benutze str_remove(), um "minutes" aus der Spalte duration von bike_share_rides zu entfernen. Füge dies als eine neue Spalte mit dem Namen duration_trimmed hinzu.
  • Wandle die Spalte duration_trimmed in einen numerischen Typ um und füge sie als neue Spalte mit dem Namen duration_mins hinzu.
  • Sieh dir bike_share_rides an und behaupte, dass die Spalte duration_mins numeric ist.
  • Berechne den Mittelwert von duration_mins.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

bike_share_rides <- bike_share_rides %>%
  # Remove 'minutes' from duration: duration_trimmed
  mutate(duration_trimmed = ___,
         # Convert duration_trimmed to numeric: duration_mins
         duration_mins = ___)

# Glimpse at bike_share_rides
___

# Assert duration_mins is numeric
___

# Calculate mean duration
___
Code bearbeiten und ausführen