Comparaison entre NLTK et spaCy NER
En utilisant le même texte que vous avez utilisé dans le premier exercice de ce chapitre, vous allez maintenant voir les résultats en utilisant l'annotateur NER de spaCy. Comment seront-ils comparés ?
L'article a été préchargé sur article
. Pour minimiser les temps d'exécution, il vous sera demandé de spécifier le mot-clé disable=['tagger', 'parser', 'matcher']
lors du chargement du modèle spaCy, car vous ne vous intéressez qu'à entity
dans cet exercice.
Cet exercice fait partie du cours
Introduction au traitement du langage naturel en Python
Instructions
- Importer
spacy
. - Chargez le modèle
'en_core_web_sm'
en utilisantspacy.load()
. Spécifiez les arguments de mots clés supplémentairesdisable=['tagger', 'parser', 'matcher']
. - Créez un objet document
spacy
en passantarticle
dansnlp()
. - En utilisant
ent
comme variable itératrice, passez en revue les entités dedoc
et imprimez les étiquettes (ent.label_
) et le texte (ent.text
).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import spacy
____
# Instantiate the English model: nlp
nlp = ____
# Create a new document: doc
doc = ____
# Print all of the found entities and their labels
for ____ in ____:
print(____, ____)