Comparando NLTK com o NER do spaCy
Usando o mesmo texto do primeiro exercício deste capítulo, você vai ver agora os resultados usando o anotador de NER do spaCy. Como eles se comparam?
O artigo já foi pré-carregado como article. Para minimizar o tempo de execução, será solicitado que você especifique o argumento nomeado disable=['tagger', 'parser', 'matcher'] ao carregar o modelo do spaCy, porque neste exercício você só se importa com entity.
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em Python
Instruções do exercício
- Importe
spacy. - Carregue o modelo
'en_core_web_sm'usandospacy.load(). Especifique os argumentos nomeados adicionaisdisable=['tagger', 'parser', 'matcher']. - Crie um objeto de documento do
spacypassandoarticleparanlp(). - Usando
entcomo sua variável de iteração, percorra as entidades dedoce imprima os rótulos (ent.label_) e o texto (ent.text).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import spacy
____
# Instantiate the English model: nlp
nlp = ____
# Create a new document: doc
doc = ____
# Print all of the found entities and their labels
for ____ in ____:
print(____, ____)