Zahlen aus Strings extrahieren
Das Feld length_of_time im UFO-Datensatz ist ein Textfeld, das die Anzahl der Minuten im String enthält. Hier extrahierst du diese Zahl mithilfe von regulären Ausdrücken aus dem Textfeld.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Durchsuche
time_stringnach Zahlen mit einem passenden RegEx-Muster. - Verwende die
.apply()-Methode, umreturn_minutes()für jede Zeile der Spaltelength_of_timeaufzurufen. - Gib die
.head()sowohl der Spaltelength_of_timeals auch der Spalteminutesaus, um sie zu vergleichen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())