Extraindo países e relacionamentos

No exercício anterior, você escreveu um script usando o PhraseMatcher do spaCy para encontrar nomes de países em um texto. Agora, vamos usar esse matcher de países em um texto maior, analisar a sintaxe e atualizar as entidades do documento com os países encontrados. O objeto nlp já foi criado.

O texto está disponível na variável text, o PhraseMatcher com os padrões de países está na variável matcher. A classe Span já foi importada.

Este exercicio faz parte do curso

NLP Avançado com spaCy

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create a doc and find matches in it
doc = ____

# Iterate over the matches
for match_id, start, end in matcher(doc):
    # Create a Span with the label for "GPE"
    span = ____(____, ____, ____, label=____)

    # Overwrite the doc.ents and add the span
    doc.ents = list(doc.ents) + [____]

# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])

Editar e Executar Código