Lange Texte zusammenfassen
Beim Zusammenfassen wird viel Text auf überschaubaren Inhalt reduziert, damit Lesende die Kernaussagen aus langen Artikeln oder Dokumenten schnell erfassen können.
Wir unterscheiden dabei zwei Hauptarten: die extraktive Zusammenfassung, bei der Schlüsselsätze aus dem Originaltext ausgewählt werden, und die abstraktive Zusammenfassung, bei der neue Sätze generiert werden, die die Hauptideen enthalten.
In dieser Übung erstellst du eine abstraktive Zusammenfassungs-Pipeline mit der pipeline()-Funktion von Hugging Face und dem Modell cnicu/t5-small-booksum. Du fasst einen Text von einer Wikipedia-Seite über Griechenland zusammen und vergleichst die umformulierte Ausgabe des abstraktiven Modells mit dem Original.
Die Funktion pipeline aus der transformers-Bibliothek und der original_text wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
Arbeiten mit Hugging Face
Anleitung zur Übung
- Erstelle die Zusammenfassungs-
pipelinemit der Task "summarization" und speichere sie alssummarizer. - Verwende die neue Pipeline, um eine Zusammenfassung des Textes zu erstellen, und speichere sie als
summary_text. - Vergleiche die Länge des Originaltexts und der Zusammenfassung.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")