Benannte Entitäten in Nachrichtenüberschriften erkennen
Nachrichtenredaktionen markieren in Überschriften häufig benannte Entitäten wie Personen, Orte und Organisationen, um Suche, Indexierung und Empfehlungen zu verbessern. Deine Aufgabe ist es, mit einer Hugging Face-Pipeline diese Entitäten in einer Nachrichtenüberschrift automatisch zu erkennen und zu gruppieren.
Diese Übung ist Teil des Kurses
<Kurs>Natural Language Processing (NLP) in Python</Kurs>Übungsanweisungen
- Erstelle eine
ner_pipelinemit dem Modell"dslim/bert-base-NER". - Extrahiere die benannten Entitäten aus der gegebenen
headline.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")