Identifier les entités nommées dans des titres d’actualité
Les médias étiquettent souvent les entités nommées — personnes, lieux et organisations — dans les titres pour améliorer la recherche, l’indexation et les recommandations. Votre objectif est d’utiliser un pipeline Hugging Face pour détecter et regrouper automatiquement ces entités dans un titre d’actualité.
Cet exercice fait partie du cours
<cours>Natural Language Processing (NLP) in Python</cours>Instructions de l’exercice
- Créez un
ner_pipelineavec le modèle"dslim/bert-base-NER". - Extrayez les entités nommées du
headlinefourni.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")