ComenzarEmpieza gratis

Extraer números de cadenas

El campo length_of_time del conjunto de datos UFO es un campo de texto que tiene el número de minutos dentro de la cadena. Aquí, extraerás ese número de ese campo de texto utilizando expresiones regulares.

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones de ejercicio

  • Busca números en time_string utilizando un patrón RegEx adecuado.
  • Utiliza el método .apply() para llamar al método return_minutes() en cada fila de la columna length_of_time.
  • Imprime la dirección .head() de las columnas length_of_time y minutes para compararlas.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

def return_minutes(time_string):

    # Search for numbers in time_string
    num = re.____(____, ____)
    if num is not None:
        return int(num.group(0))
        
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____

# Take a look at the head of both of the columns
print(ufo[[____]].head())
Editar y ejecutar código