ComeçarComece de graça

NER em espanhol com polyglot

Você vai continuar explorando o polyglot agora com alguma anotação em espanhol. Este artigo não foi escrito por um jornal, então é seu primeiro exemplo de um texto mais parecido com blog. Como você acha que isso pode impactar a identificação de entidades?

O objeto Text foi criado como txt, e cada entidade foi impressa, como você pode ver no IPython Shell.

Sua tarefa específica é determinar quantas das entidades contêm as palavras "Márquez" ou "Gabo" — elas se referem à mesma pessoa de maneiras diferentes!

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em Python

Ver curso

Instruções do exercício

  • Percorra todas as entidades de txt, usando ent como sua variável iteradora.
  • Verifique se a entidade contém "Márquez" ou "Gabo". Se contiver, incremente count. Não se esqueça de incluir o á com acento em "Márquez"!
  • Clique em 'Enviar Resposta' para ver qual porcentagem das entidades se refere a Gabriel García Márquez (também conhecido como Gabo).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the count variable: count
count = 0

# Iterate over all the entities
____
    # Check whether the entity contains 'Márquez' or 'Gabo'
    ____
        # Increment count
        ____

# Print count
print(count)

# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)
Editar e executar o código