LoslegenKostenlos loslegen

Zahlen aus Strings extrahieren

Das Feld length_of_time im UFO-Datensatz ist ein Textfeld, das die Anzahl der Minuten im String enthält. Hier extrahierst du diese Zahl mithilfe von regulären Ausdrücken aus dem Textfeld.

Diese Übung ist Teil des Kurses

Vorverarbeitung für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Durchsuche time_string nach Zahlen mit einem passenden RegEx-Muster.
  • Verwende die .apply()-Methode, um return_minutes() für jede Zeile der Spalte length_of_time aufzurufen.
  • Gib die .head() sowohl der Spalte length_of_time als auch der Spalte minutes aus, um sie zu vergleichen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

def return_minutes(time_string):

    # Search for numbers in time_string
    num = re.____(____, ____)
    if num is not None:
        return int(num.group(0))
        
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____

# Take a look at the head of both of the columns
print(ufo[[____]].head())
Code bearbeiten und ausführen