ComenzarEmpieza gratis

RegEx en Python

La extracción de información basada en reglas es útil para muchas tareas de NLP. Ciertos tipos de entidades, como fechas o números de teléfono, tienen formatos definidos que pueden reconocerse mediante un conjunto de reglas sin necesidad de entrenar ningún modelo. En este ejercicio practicarás el uso del paquete re para RegEx. El objetivo es encontrar números de teléfono en un text dado.

El paquete re ya está importado para que lo uses. Puedes usar \d para hacer coincidir patrones de cadena representativos de un metacarácter que coincide con cualquier dígito del 0 al 9.

Este ejercicio forma parte del curso

Procesamiento del Lenguaje Natural con spaCy

Ver curso

Instrucciones del ejercicio

  • Define un patrón para coincidir con números de teléfono del formato (111)-111-1111.
  • Encuentra todos los patrones coincidentes usando el método re.finditer().
  • Para cada coincidencia, imprime los caracteres de inicio y fin y la sección coincidente del text dado.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

text = "Our phone number is (425)-123-4567."

# Define a pattern to match phone numbers
pattern = r"\((____){____}\)-(____){____}-(____){____}"

# Find all the matching patterns in the text
phones = re.____(pattern, text)

# Print start and end characters and matching section of the text
for match in phones:
    start_char = match.____
    end_char = match.____
    print("Start character: ", ____, "| End character: ", ____, "| Matching text: ", text[____:____])
Editar y ejecutar código