Estrarre numeri dalle stringhe
Il campo length_of_time nel dataset sugli UFO è un campo di testo che contiene il numero di minuti all'interno della stringa. Qui estrarrai quel numero dal campo di testo usando le espressioni regolari.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Cerca numeri in
time_stringusando un pattern RegEx appropriato. - Usa il metodo
.apply()per chiamarereturn_minutes()su ogni riga della colonnalength_of_time. - Stampa
.head()sia della colonnalength_of_timesia della colonnaminutesper confrontarle.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())