ComeçarComece de graça

Identificando entidades nomeadas em manchetes de notícias

Redações costumam marcar entidades nomeadas como pessoas, locais e organizações nas manchetes para melhorar busca, indexação e recomendações. Sua tarefa é usar um pipeline do Hugging Face para detectar e agrupar automaticamente essas entidades em uma manchete de notícia.

Este exercício faz parte do curso

Processamento de Linguagem Natural (NLP) em Python

Ver curso

Instruções do exercício

  • Crie um ner_pipeline usando o modelo "dslim/bert-base-NER".
  • Extraia as entidades nomeadas do headline fornecido.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
    task="____",
    model="____",
    grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."

# Get named entities
entities = ____

for entity in entities:
    print(f"{entity['entity_group']}: {entity['word']}")
Editar e executar o código