IniziaInizia gratis

Estrarre numeri dalle stringhe

Il campo length_of_time nel dataset sugli UFO è un campo di testo che contiene il numero di minuti all'interno della stringa. Qui estrarrai quel numero dal campo di testo usando le espressioni regolari.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Cerca numeri in time_string usando un pattern RegEx appropriato.
  • Usa il metodo .apply() per chiamare return_minutes() su ogni riga della colonna length_of_time.
  • Stampa .head() sia della colonna length_of_time sia della colonna minutes per confrontarle.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

def return_minutes(time_string):

    # Search for numbers in time_string
    num = re.____(____, ____)
    if num is not None:
        return int(num.group(0))
        
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____

# Take a look at the head of both of the columns
print(ufo[[____]].head())
Modifica ed esegui il codice