ComeçarComece de graça

Comparando NLTK com o NER do spaCy

Usando o mesmo texto do primeiro exercício deste capítulo, você vai ver agora os resultados usando o anotador de NER do spaCy. Como eles se comparam?

O artigo já foi pré-carregado como article. Para minimizar o tempo de execução, será solicitado que você especifique o argumento nomeado disable=['tagger', 'parser', 'matcher'] ao carregar o modelo do spaCy, porque neste exercício você só se importa com entity.

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em Python

Ver curso

Instruções do exercício

  • Importe spacy.
  • Carregue o modelo 'en_core_web_sm' usando spacy.load(). Especifique os argumentos nomeados adicionais disable=['tagger', 'parser', 'matcher'].
  • Crie um objeto de documento do spacy passando article para nlp().
  • Usando ent como sua variável de iteração, percorra as entidades de doc e imprima os rótulos (ent.label_) e o texto (ent.text).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import spacy
____

# Instantiate the English model: nlp
nlp = ____

# Create a new document: doc
doc = ____

# Print all of the found entities and their labels
for ____ in ____:
    print(____, ____)
Editar e executar o código