Identificar entidades con nombre en titulares de noticias
Los medios suelen etiquetar entidades con nombre como personas, lugares y organizaciones en los titulares para mejorar la búsqueda, la indexación y las recomendaciones. Tu tarea es usar un pipeline de Hugging Face para detectar y agrupar automáticamente estas entidades en un titular de noticias.
Este ejercicio forma parte del curso
Natural Language Processing (NLP) en Python
Instrucciones del ejercicio
- Crea un
ner_pipelineusando el modelo"dslim/bert-base-NER". - Extrae las entidades con nombre de la
headlinedada.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")