Identificando entidades nomeadas em manchetes de notícias
As organizações de notícias costumam marcar entidades nomeadas, como pessoas, lugares e organizações, nas manchetes para melhorar a pesquisa, a indexação e as recomendações. A tua tarefa é usar um pipeline do Hugging Face para detectar e agrupar automaticamente essas entidades em uma manchete de notícias.
Este exercício faz parte do curso
Processamento de Linguagem Natural (NLP) em Python
Instruções do exercício
- Crie um “
ner_pipeline
” usando o modelo “"dslim/bert-base-NER"
”. - Pega as entidades nomeadas do texto
headline
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")