Lange Texte zusammenfassen
Die Zusammenfassung reduziert umfangreiche Texte auf überschaubare Inhalte und hilft den Lesern, die wichtigsten Punkte aus langen Artikeln oder Dokumenten schnell zu erfassen.
Es gibt zwei Haupttypen: extraktive, die Schlüsselsätze aus dem Originaltext heraussuchen, und abstrakte, die neue Sätze erzeugen, die die Hauptideen zusammenfassen.
In dieser Übung erstellst du eine abstrakte Zusammenfassungspipeline mit der Funktion pipeline()
von Hugging Face und dem Modell cnicu/t5-small-booksum
. Du fasst einen Text aus einer Wikipedia-Seite über Griechenland zusammen und vergleichst die umformulierte Ausgabe des Abstraktionsmodells mit dem Original.
Die Funktion pipeline
aus der Bibliothek transformers
und die Funktion original_text
sind bereits für dich geladen worden.
Diese Übung ist Teil des Kurses
Arbeiten mit Hugging Face
Anleitung zur Übung
- Erstelle die Verdichtung
pipeline
mit der Aufgabe "Verdichtung" und speichere sie alssummarizer
. - Verwende die neue Pipeline, um eine Zusammenfassung des Textes zu erstellen und speichere sie als
summary_text
. - Vergleiche die Länge des Originaltextes und der Zusammenfassung.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")