Lange Texte zusammenfassen
Beim Zusammenfassen wird viel Text auf überschaubaren Inhalt reduziert, damit Lesende die Kernaussagen aus langen Artikeln oder Dokumenten schnell erfassen können.
Wir unterscheiden dabei zwei Hauptarten: die extraktive Zusammenfassung, bei der Schlüsselsätze aus dem Originaltext ausgewählt werden, und die abstraktive Zusammenfassung, bei der neue Sätze generiert werden, die die Hauptideen enthalten.
In dieser Übung erstellst du eine abstraktive Zusammenfassungs-Pipeline mit der pipeline()-Funktion von Hugging Face und dem Modell cnicu/t5-small-booksum. Du fasst einen Text von einer Wikipedia-Seite über Griechenland zusammen und vergleichst die umformulierte Ausgabe des abstraktiven Modells mit dem Original.
Die Funktion pipeline aus der transformers-Bibliothek und der original_text wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Arbeiten mit Hugging Face</Kurs>Übungsanweisungen
- Erstelle die Zusammenfassungs-
pipelinemit der Task "summarization" und speichere sie alssummarizer. - Verwende die neue Pipeline, um eine Zusammenfassung des Textes zu erstellen, und speichere sie als
summary_text. - Vergleiche die Länge des Originaltexts und der Zusammenfassung.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")