Espanhol NER com poliglota
Você continuará a explorar o site polyglot
agora com algumas anotações em espanhol. Este artigo não foi escrito por um jornal, portanto, é o primeiro exemplo de um texto mais parecido com um blog. Como você acha que isso pode ser comparado ao encontrar entidades?
O objeto Text
foi criado como txt
e cada entidade foi impressa, como você pode ver no Shell ython IP.
Sua tarefa específica é determinar quantas entidades contêm as palavras "Márquez"
ou "Gabo"
- elas se referem à mesma pessoa de maneiras diferentes!
Este exercício faz parte do curso
Introdução ao processamento de linguagem natural em Python
Instruções de exercício
- Itere sobre todas as entidades de
txt
, usandoent
como sua variável de iteração. - Verifique se a entidade contém
"Márquez"
ou"Gabo"
. Se isso acontecer, incrementecount
. Não se esqueça de incluir o acentoá
em"Márquez"
! - Clique em "Enviar resposta" para ver qual porcentagem de entidades se refere a Gabriel García Márquez (também conhecido como Gabo).
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)