Identificando entidades nomeadas em manchetes de notícias
Redações costumam marcar entidades nomeadas como pessoas, locais e organizações nas manchetes para melhorar busca, indexação e recomendações. Sua tarefa é usar um pipeline do Hugging Face para detectar e agrupar automaticamente essas entidades em uma manchete de notícia.
Este exercicio faz parte do curso
Processamento de Linguagem Natural (NLP) em Python
Instruções do exercicio
- Crie um
ner_pipelineusando o modelo"dslim/bert-base-NER". - Extraia as entidades nomeadas do
headlinefornecido.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")