Erste SchritteKostenlos loslegen

Summieren von Zeichenketten und Verketten von Zahlen

In der vorangegangenen Übung konntest du feststellen, dass category der richtige Datentyp für user_type ist, und ihn umwandeln, um relevante statistische Zusammenfassungen zu extrahieren, die Aufschluss über die Verteilung von user_type geben.

Ein weiteres häufiges Problem bei Datentypen ist der Import von numerischen Werten als Zeichenketten, da mathematische Operationen wie Summierung und Multiplikation zu einer Verkettung dieser Zeichenketten und nicht zu numerischen Ausgaben führen.

In dieser Übung wirst du die Zeichenkettenspalte duration in den Typ int konvertieren. Zuvor musst du jedoch sicherstellen, dass du "minutes" aus der Spalte entfernst, damit pandas sie als numerisch liest. Das Paket pandas wurde als pd importiert.

Diese Übung ist Teil des Kurses

Datenbereinigung in Python

Kurs anzeigen

Anleitung zur Übung

  • Verwende die Methode .strip(), um "minutes" aus duration zu entfernen, und speichere das Ergebnis in der Spalte duration_trim.
  • Wandle duration_trim in int um und speichere dies in der Spalte duration_time.
  • Schreibe eine assert-Anweisung, die prüft, ob der Datentyp von duration_time jetzt int ist.
  • Drucke die durchschnittliche Fahrtdauer aus.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()

# Convert duration to integer
ride_sharing['duration_time'] = ____

# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'

# Print formed columns and calculate average ride duration 
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)
Bearbeiten und Ausführen von Code