Aan de slagBegin gratis

Getallen uit strings halen

Het veld length_of_time in de UFO-gegevensset is een tekstveld waarin het aantal minuten in de string staat. Hier ga je dat getal uit dat tekstveld halen met reguliere expressies.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Bekijk cursus

Oefeninstructies

  • Zoek in time_string naar getallen met een passend RegEx-patroon.
  • Gebruik de methode .apply() om return_minutes() aan te roepen op elke rij van de kolom length_of_time.
  • Print de .head() van zowel de kolommen length_of_time als minutes om te vergelijken.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

def return_minutes(time_string):

    # Search for numbers in time_string
    num = re.____(____, ____)
    if num is not None:
        return int(num.group(0))
        
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____

# Take a look at the head of both of the columns
print(ufo[[____]].head())
Code bewerken en uitvoeren