IniziaInizia gratis

Estrarre pattern dalle stringhe

La colonna Length nel dataset hiking è una colonna di stringhe, ma al suo interno c'è il numero di miglia dell'escursione. Useremo le espressioni regolari per estrarre questo valore e poi una lambda in pandas per applicare l'estrazione al DataFrame.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Cerca nel testo dell'argomento length numeri e decimali usando un pattern appropriato.
  • Estrai il pattern trovato e converti il risultato in un float.
  • Applica la funzione return_mileage() a ogni riga della colonna hiking["Length"].

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Write a pattern to extract numbers and decimals
def return_mileage(length):
    
    # Search the text for matches
    mile = re.____(____, ____)
    
    # If a value is returned, use group(0) to return the found value
    if mile is not None:
        return float(____)
        
# Apply the function to the Length column and take a look at both columns
hiking["Length_num"] = ____.apply(____)
print(hiking[["Length", "Length_num"]].head())
Modifica ed esegui il codice