Extraindo países e relacionamentos
No exercício anterior, você escreveu um script usando o PhraseMatcher do spaCy para encontrar nomes de países em um texto. Agora, vamos usar esse matcher de países em um texto maior, analisar a sintaxe e atualizar as entidades do documento com os países encontrados. O objeto nlp já foi criado.
O texto está disponível na variável text, o PhraseMatcher com os padrões de países está na variável matcher. A classe Span já foi importada.
Este exercício faz parte do curso
NLP Avançado com spaCy
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a doc and find matches in it
doc = ____
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Create a Span with the label for "GPE"
span = ____(____, ____, ____, label=____)
# Overwrite the doc.ents and add the span
doc.ents = list(doc.ents) + [____]
# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])