CommencerCommencer gratuitement

Identification d'entités nommées dans les titres d'actualités

Les organes de presse ajoutent souvent des balises aux entités nommées telles que les personnes, les lieux et les organisations dans les titres afin d'améliorer la recherche, l'indexation et les recommandations. Votre tâche consiste à utiliser un pipeline Hugging Face pour détecter et regrouper automatiquement ces entités dans un titre d'actualité.

Cet exercice fait partie du cours

Traitement du langage naturel (NLP) en Python

Afficher le cours

Instructions

  • Veuillez créer une analyse de la valeur ajoutée ( ner_pipeline ) en utilisant le modèle de la chaîne de valeur de l'innovation ( "dslim/bert-base-NER"
  • Extrayez les entités nommées de l'headline e fournie.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
    task="____",
    model="____",
    grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."

# Get named entities
entities = ____

for entity in entities:
    print(f"{entity['entity_group']}: {entity['word']}")
Modifier et exécuter le code