Benannte Entitäten in Nachrichtenüberschriften erkennen
Nachrichtenredaktionen markieren in Überschriften häufig benannte Entitäten wie Personen, Orte und Organisationen, um Suche, Indexierung und Empfehlungen zu verbessern. Deine Aufgabe ist es, mit einer Hugging Face-Pipeline diese Entitäten in einer Nachrichtenüberschrift automatisch zu erkennen und zu gruppieren.
Diese Übung ist Teil des Kurses
Natural Language Processing (NLP) in Python
Anleitung zur Übung
- Erstelle eine
ner_pipelinemit dem Modell"dslim/bert-base-NER". - Extrahiere die benannten Entitäten aus der gegebenen
headline.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")