Extracción de países y relaciones

En el ejercicio anterior, escribiste un script usando el PhraseMatcher de spaCy para encontrar nombres de países en un texto. Ahora vamos a usar ese buscador de países en un texto más largo, analizar la sintaxis y actualizar las entidades del documento con los países encontrados. El objeto nlp ya ha sido creado.

El texto está disponible en la variable text, el PhraseMatcher con los patrones de países en la variable matcher. La clase Span ya se ha importado.

Este ejercicio forma parte del curso

NLP avanzado con spaCy

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Create a doc and find matches in it
doc = ____

# Iterate over the matches
for match_id, start, end in matcher(doc):
    # Create a Span with the label for "GPE"
    span = ____(____, ____, ____, label=____)

    # Overwrite the doc.ents and add the span
    doc.ents = list(doc.ents) + [____]

# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])

Editar y ejecutar código