Comparer la reconnaissance d’entités nommées de NLTK et de spaCy

En réutilisant le même texte que dans le premier exercice de ce chapitre, vous allez cette fois examiner les résultats avec l’annotateur de reconnaissance d’entités nommées (NER) de spaCy. Comment vont-ils se comparer ?

L’article a déjà été chargé dans article. Pour réduire le temps d’exécution, il vous est demandé de préciser l’argument nommé disable=['tagger', 'parser', 'matcher'] lors du chargement du modèle spaCy, car dans cet exercice vous vous concentrez uniquement sur entity.

Cet exercice fait partie du cours

<cours>Introduction au Natural Language Processing (NLP) en Python</cours>

Voir le cours

Instructions de l’exercice

Importez spacy.
Chargez le modèle 'en_core_web_sm' avec spacy.load(). Indiquez les arguments nommés supplémentaires disable=['tagger', 'parser', 'matcher'].
Créez un objet document spacy en passant article à nlp().
En utilisant ent comme variable d’itération, parcourez les entités de doc et affichez leurs libellés (ent.label_) et leur texte (ent.text).

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import spacy
____

# Instantiate the English model: nlp
nlp = ____

# Create a new document: doc
doc = ____

# Print all of the found entities and their labels
for ____ in ____:
    print(____, ____)

Modifier et exécuter le code