CommencerCommencer gratuitement

Reconnaissance d’entités nommées (NER) avec spaCy

La reconnaissance d’entités nommées (Named Entity Recognition, NER) permet d’identifier facilement les éléments clés d’un document, comme les noms de personnes et de lieux. Elle aide à structurer des données non structurées et à détecter des informations importantes, ce qui est essentiel lorsque vous traitez de grands jeux de données. Dans cet exercice, vous allez vous entraîner à la NER.

en_core_web_sm a été chargé pour vous sous le nom nlp. Trois commentaires issus du jeu de données Airline Travel Information System (ATIS) vous sont fournis dans une liste appelée texts.

Cet exercice fait partie du cours

Traitement du langage naturel avec spaCy

Afficher le cours

Instructions

  • Constituez documents, une liste de tous les conteneurs Doc pour chaque texte de texts en utilisant une compréhension de liste.
  • Pour chaque conteneur doc, affichez le texte de chaque entité et son libellé correspondant en itérant sur doc.ents.
  • Affichez le texte du sixième token, ainsi que le type d’entité du deuxième conteneur Doc.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compile a list of all Doc containers of texts
documents = [____ for text in texts]

# Print the entity text and label for the entities in each document
for doc in documents:
    print([(____, ____) for ent in ____])
    
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)
Modifier et exécuter le code