CommencerCommencer gratuitement

Identifier les entités nommées dans des titres d’actualité

Les médias étiquettent souvent les entités nommées — personnes, lieux et organisations — dans les titres pour améliorer la recherche, l’indexation et les recommandations. Votre objectif est d’utiliser un pipeline Hugging Face pour détecter et regrouper automatiquement ces entités dans un titre d’actualité.

Cet exercice fait partie du cours

Natural Language Processing (NLP) in Python

Afficher le cours

Instructions

  • Créez un ner_pipeline avec le modèle "dslim/bert-base-NER".
  • Extrayez les entités nommées du headline fourni.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
    task="____",
    model="____",
    grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."

# Get named entities
entities = ____

for entity in entities:
    print(f"{entity['entity_group']}: {entity['word']}")
Modifier et exécuter le code