Summieren von Zeichenketten und Verketten von Zahlen
In der vorangegangenen Übung konntest du feststellen, dass category
der richtige Datentyp für user_type
ist, und ihn umwandeln, um relevante statistische Zusammenfassungen zu extrahieren, die Aufschluss über die Verteilung von user_type
geben.
Ein weiteres häufiges Problem bei Datentypen ist der Import von numerischen Werten als Zeichenketten, da mathematische Operationen wie Summierung und Multiplikation zu einer Verkettung dieser Zeichenketten und nicht zu numerischen Ausgaben führen.
In dieser Übung wirst du die Zeichenkettenspalte duration
in den Typ int
konvertieren. Zuvor musst du jedoch sicherstellen, dass du "minutes"
aus der Spalte entfernst, damit pandas
sie als numerisch liest. Das Paket pandas
wurde als pd
importiert.
Diese Übung ist Teil des Kurses
Datenbereinigung in Python
Anleitung zur Übung
- Verwende die Methode
.strip()
, um"minutes"
ausduration
zu entfernen, und speichere das Ergebnis in der Spalteduration_trim
. - Wandle
duration_trim
inint
um und speichere dies in der Spalteduration_time
. - Schreibe eine
assert
-Anweisung, die prüft, ob der Datentyp vonduration_time
jetztint
ist. - Drucke die durchschnittliche Fahrtdauer aus.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()
# Convert duration to integer
ride_sharing['duration_time'] = ____
# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'
# Print formed columns and calculate average ride duration
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)