Identificando entidades nomeadas em manchetes de notícias
Redações costumam marcar entidades nomeadas como pessoas, locais e organizações nas manchetes para melhorar busca, indexação e recomendações. Sua tarefa é usar um pipeline do Hugging Face para detectar e agrupar automaticamente essas entidades em uma manchete de notícia.
Este exercício faz parte do curso
Processamento de Linguagem Natural (NLP) em Python
Instruções do exercício
- Crie um
ner_pipelineusando o modelo"dslim/bert-base-NER". - Extraia as entidades nomeadas do
headlinefornecido.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")