Comparando NLTK com spaCy NER
Usando o mesmo texto que você usou no primeiro exercício deste capítulo, você verá agora os resultados usando o anotador NER do spaCy. Como você vai se comparar?
O artigo foi pré-carregado como article
. Para minimizar o tempo de execução, será solicitado que você especifique o argumento de palavra-chave disable=['tagger', 'parser', 'matcher']
ao carregar o modelo spaCy, pois você só se preocupa com o entity
neste exercício.
Este exercício faz parte do curso
Introdução ao processamento de linguagem natural em Python
Instruções de exercício
- Importar
spacy
. - Carregue o modelo
'en_core_web_sm'
usandospacy.load()
. Especifique os argumentos adicionais da palavra-chavedisable=['tagger', 'parser', 'matcher']
. - Crie um objeto de documento
spacy
passandoarticle
paranlp()
. - Usando
ent
como sua variável de iteração, itere sobre as entidades dedoc
e imprima os rótulos (ent.label_
) e o texto (ent.text
).
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import spacy
____
# Instantiate the English model: nlp
nlp = ____
# Create a new document: doc
doc = ____
# Print all of the found entities and their labels
for ____ in ____:
print(____, ____)