LoslegenKostenlos starten

Zahlen aus Strings extrahieren

Das Feld length_of_time im UFO-Datensatz ist ein Textfeld, das die Anzahl der Minuten im String enthält. Hier extrahierst du diese Zahl mithilfe von regulären Ausdrücken aus dem Textfeld.

Diese Übung ist Teil des Kurses

<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Durchsuche time_string nach Zahlen mit einem passenden RegEx-Muster.
  • Verwende die .apply()-Methode, um return_minutes() für jede Zeile der Spalte length_of_time aufzurufen.
  • Gib die .head() sowohl der Spalte length_of_time als auch der Spalte minutes aus, um sie zu vergleichen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

def return_minutes(time_string):

    # Search for numbers in time_string
    num = re.____(____, ____)
    if num is not None:
        return int(num.group(0))
        
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____

# Take a look at the head of both of the columns
print(ufo[[____]].head())
Code bearbeiten und ausführen