Comparando NLTK com spaCy NER

Usando o mesmo texto que você usou no primeiro exercício deste capítulo, você verá agora os resultados usando o anotador NER do spaCy. Como você vai se comparar?

O artigo foi pré-carregado como article. Para minimizar o tempo de execução, será solicitado que você especifique o argumento de palavra-chave disable=['tagger', 'parser', 'matcher'] ao carregar o modelo spaCy, pois você só se preocupa com o entity neste exercício.

Este exercício faz parte do curso

Introdução ao processamento de linguagem natural em Python

Ver Curso

Instruções de exercício

  • Importar spacy.
  • Carregue o modelo 'en_core_web_sm' usando spacy.load(). Especifique os argumentos adicionais da palavra-chave disable=['tagger', 'parser', 'matcher'].
  • Crie um objeto de documento spacy passando article para nlp().
  • Usando ent como sua variável de iteração, itere sobre as entidades de doc e imprima os rótulos (ent.label_) e o texto (ent.text).

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import spacy
____

# Instantiate the English model: nlp
nlp = ____

# Create a new document: doc
doc = ____

# Print all of the found entities and their labels
for ____ in ____:
    print(____, ____)