Zahlen aus Strings extrahieren
Das Feld length_of_time im UFO-Datensatz ist ein Textfeld, das die Anzahl der Minuten im String enthält. Hier extrahierst du diese Zahl mithilfe von regulären Ausdrücken aus dem Textfeld.
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Durchsuche
time_stringnach Zahlen mit einem passenden RegEx-Muster. - Verwende die
.apply()-Methode, umreturn_minutes()für jede Zeile der Spaltelength_of_timeaufzurufen. - Gib die
.head()sowohl der Spaltelength_of_timeals auch der Spalteminutesaus, um sie zu vergleichen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())