CommencerCommencer gratuitement

Comparaison entre NLTK et spaCy NER

En utilisant le même texte que vous avez utilisé dans le premier exercice de ce chapitre, vous allez maintenant voir les résultats en utilisant l'annotateur NER de spaCy. Comment seront-ils comparés ?

L'article a été préchargé sur article. Pour minimiser les temps d'exécution, il vous sera demandé de spécifier le mot-clé disable=['tagger', 'parser', 'matcher'] lors du chargement du modèle spaCy, car vous ne vous intéressez qu'à entity dans cet exercice.

Cet exercice fait partie du cours

Introduction au traitement du langage naturel en Python

Afficher le cours

Instructions

  • Importer spacy.
  • Chargez le modèle 'en_core_web_sm' en utilisant spacy.load(). Spécifiez les arguments de mots clés supplémentaires disable=['tagger', 'parser', 'matcher'].
  • Créez un objet document spacy en passant article dans nlp().
  • En utilisant ent comme variable itératrice, passez en revue les entités de doc et imprimez les étiquettes (ent.label_) et le texte (ent.text).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import spacy
____

# Instantiate the English model: nlp
nlp = ____

# Create a new document: doc
doc = ____

# Print all of the found entities and their labels
for ____ in ____:
    print(____, ____)
Modifier et exécuter le code