Named Entities in Schlagzeilen erkennen
Nachrichtenagenturen markieren oft Namen von Personen, Orten und Organisationen in Überschriften, um die Suche, Indizierung und Empfehlungen zu verbessern. Deine Aufgabe ist es, mit einer Hugging Face-Pipeline diese Entitäten in einer Schlagzeile automatisch zu erkennen und zu gruppieren.
Diese Übung ist Teil des Kurses
Natürliche Sprachverarbeitung (NLP) in Python
Anleitung zur Übung
- Erstell eine „
ner_pipeline
” (Erste Schritte mit dem „"dslim/bert-base-NER"
”-Modell). - Extrahier die genannten Entitäten aus dem angegebenen Dokument „
headline
“.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from transformers import pipeline
# Create the NER pipeline
ner_pipeline = pipeline(
task="____",
model="____",
grouped_entities=True
)
headline = "Apple is planning to open a new office in San Francisco next year."
# Get named entities
entities = ____
for entity in entities:
print(f"{entity['entity_group']}: {entity['word']}")