NER em espanhol com polyglot
Você vai continuar explorando o polyglot agora com alguma anotação em espanhol. Este artigo não foi escrito por um jornal, então é seu primeiro exemplo de um texto mais parecido com blog. Como você acha que isso pode impactar a identificação de entidades?
O objeto Text foi criado como txt, e cada entidade foi impressa, como você pode ver no IPython Shell.
Sua tarefa específica é determinar quantas das entidades contêm as palavras "Márquez" ou "Gabo" — elas se referem à mesma pessoa de maneiras diferentes!
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em Python
Instruções do exercício
- Percorra todas as entidades de
txt, usandoentcomo sua variável iteradora. - Verifique se a entidade contém
"Márquez"ou"Gabo". Se contiver, incrementecount. Não se esqueça de incluir oácom acento em"Márquez"! - Clique em 'Enviar Resposta' para ver qual porcentagem das entidades se refere a Gabriel García Márquez (também conhecido como Gabo).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)