Identifier les entités nommées dans des titres d’actualité
Les médias étiquettent souvent les entités nommées — personnes, lieux et organisations — dans les titres pour améliorer la recherche, l’indexation et les recommandations. Votre objectif est d’utiliser un pipeline Hugging Face pour détecter et regrouper automatiquement ces entités dans un titre d’actualité.
Cet exercice fait partie du cours
Natural Language Processing (NLP) in Python
Instructions
- Créez un
ner_pipelineavec le modèle"dslim/bert-base-NER". - Extrayez les entités nommées du
headlinefourni.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")