ComenzarEmpieza gratis

Extraer patrones de cadenas

La columna Length del conjunto de datos hiking es una columna de cadenas, pero dentro de la columna está el kilometraje de la caminata. Vamos a extraer este kilometraje utilizando expresiones regulares, y luego utilizaremos una lambda en pandas para aplicar la extracción al DataFrame.

Este ejercicio forma parte del curso

Preprocesamiento para machine learning en Python

Ver curso

Instrucciones de ejercicio

  • Busca en el texto del argumento length números y decimales utilizando un patrón adecuado.
  • Extrae el patrón coincidente y conviértelo en un flotante.
  • Aplica la función return_mileage() a cada fila de la columna hiking["Length"].

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Write a pattern to extract numbers and decimals
def return_mileage(length):
    
    # Search the text for matches
    mile = re.____(____, ____)
    
    # If a value is returned, use group(0) to return the found value
    if mile is not None:
        return float(____)
        
# Apply the function to the Length column and take a look at both columns
hiking["Length_num"] = ____.apply(____)
print(hiking[["Length", "Length_num"]].head())
Editar y ejecutar código