Estrarre pattern dalle stringhe
La colonna Length nel dataset hiking è una colonna di stringhe, ma al suo interno c'è il numero di miglia dell'escursione. Useremo le espressioni regolari per estrarre questo valore e poi una lambda in pandas per applicare l'estrazione al DataFrame.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Cerca nel testo dell'argomento
lengthnumeri e decimali usando un pattern appropriato. - Estrai il pattern trovato e converti il risultato in un float.
- Applica la funzione
return_mileage()a ogni riga della colonnahiking["Length"].
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Write a pattern to extract numbers and decimals
def return_mileage(length):
# Search the text for matches
mile = re.____(____, ____)
# If a value is returned, use group(0) to return the found value
if mile is not None:
return float(____)
# Apply the function to the Length column and take a look at both columns
hiking["Length_num"] = ____.apply(____)
print(hiking[["Length", "Length_num"]].head())