Comparando NLTK com spaCy NER
Usando o mesmo texto que você usou no primeiro exercício deste capítulo, você verá agora os resultados usando o anotador NER do spaCy. Como você vai se comparar?
O artigo foi pré-carregado como article. Para minimizar o tempo de execução, será solicitado que você especifique o argumento de palavra-chave disable=['tagger', 'parser', 'matcher'] ao carregar o modelo spaCy, pois você só se preocupa com o entity neste exercício.
Este exercício faz parte do curso
Introdução ao processamento de linguagem natural em Python
Instruções do exercício
- Importar
spacy. - Carregue o modelo
'en_core_web_sm'usandospacy.load(). Especifique os argumentos adicionais da palavra-chavedisable=['tagger', 'parser', 'matcher']. - Crie um objeto de documento
spacypassandoarticleparanlp(). - Usando
entcomo sua variável de iteração, itere sobre as entidades dedoce imprima os rótulos (ent.label_) e o texto (ent.text).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import spacy
____
# Instantiate the English model: nlp
nlp = ____
# Create a new document: doc
doc = ____
# Print all of the found entities and their labels
for ____ in ____:
print(____, ____)