Extracción de países y relaciones
En el ejercicio anterior, escribiste un script usando el PhraseMatcher de spaCy para encontrar nombres de países en un texto. Ahora vamos a usar ese buscador de países en un texto más largo, analizar la sintaxis y actualizar las entidades del documento con los países encontrados. El objeto nlp ya ha sido creado.
El texto está disponible en la variable text, el PhraseMatcher con los patrones de países en la variable matcher. La clase Span ya se ha importado.
Este ejercicio forma parte del curso
NLP avanzado con spaCy
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a doc and find matches in it
doc = ____
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Create a Span with the label for "GPE"
span = ____(____, ____, ____, label=____)
# Overwrite the doc.ents and add the span
doc.ents = list(doc.ents) + [____]
# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])