Extraer patrones de cadenas
La columna Length
del conjunto de datos hiking
es una columna de cadenas, pero dentro de la columna está el kilometraje de la caminata. Vamos a extraer este kilometraje utilizando expresiones regulares, y luego utilizaremos una lambda en pandas para aplicar la extracción al DataFrame.
Este ejercicio forma parte del curso
Preprocesamiento para machine learning en Python
Instrucciones de ejercicio
- Busca en el texto del argumento
length
números y decimales utilizando un patrón adecuado. - Extrae el patrón coincidente y conviértelo en un flotante.
- Aplica la función
return_mileage()
a cada fila de la columnahiking["Length"]
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Write a pattern to extract numbers and decimals
def return_mileage(length):
# Search the text for matches
mile = re.____(____, ____)
# If a value is returned, use group(0) to return the found value
if mile is not None:
return float(____)
# Apply the function to the Length column and take a look at both columns
hiking["Length_num"] = ____.apply(____)
print(hiking[["Length", "Length_num"]].head())