Identification d'entités nommées dans les titres d'actualités
Les organes de presse ajoutent souvent des balises aux entités nommées telles que les personnes, les lieux et les organisations dans les titres afin d'améliorer la recherche, l'indexation et les recommandations. Votre tâche consiste à utiliser un pipeline Hugging Face pour détecter et regrouper automatiquement ces entités dans un titre d'actualité.
Cet exercice fait partie du cours
Traitement du langage naturel (NLP) en Python
Instructions
- Veuillez créer une analyse de la valeur ajoutée (
ner_pipeline
) en utilisant le modèle de la chaîne de valeur de l'innovation ("dslim/bert-base-NER"
- Extrayez les entités nommées de l'
headline
e fournie.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")