Extraer números de cadenas
El campo length_of_time
del conjunto de datos UFO es un campo de texto que tiene el número de minutos dentro de la cadena. Aquí, extraerás ese número de ese campo de texto utilizando expresiones regulares.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Busca números en
time_string
utilizando un patrón RegEx adecuado. - Utiliza el método
.apply()
para llamar al métodoreturn_minutes()
en cada fila de la columnalength_of_time
. - Imprime la dirección
.head()
de las columnaslength_of_time
yminutes
para compararlas.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())