LoslegenKostenlos loslegen

Lange Texte zusammenfassen

Beim Zusammenfassen wird viel Text auf überschaubaren Inhalt reduziert, damit Lesende die Kernaussagen aus langen Artikeln oder Dokumenten schnell erfassen können.

Wir unterscheiden dabei zwei Hauptarten: die extraktive Zusammenfassung, bei der Schlüsselsätze aus dem Originaltext ausgewählt werden, und die abstraktive Zusammenfassung, bei der neue Sätze generiert werden, die die Hauptideen enthalten.

In dieser Übung erstellst du eine abstraktive Zusammenfassungs-Pipeline mit der pipeline()-Funktion von Hugging Face und dem Modell cnicu/t5-small-booksum. Du fasst einen Text von einer Wikipedia-Seite über Griechenland zusammen und vergleichst die umformulierte Ausgabe des abstraktiven Modells mit dem Original.

Die Funktion pipeline aus der transformers-Bibliothek und der original_text wurden bereits für dich geladen.

Diese Übung ist Teil des Kurses

Arbeiten mit Hugging Face

Kurs anzeigen

Anleitung zur Übung

  • Erstelle die Zusammenfassungs-pipeline mit der Task "summarization" und speichere sie als summarizer.
  • Verwende die neue Pipeline, um eine Zusammenfassung des Textes zu erstellen, und speichere sie als summary_text.
  • Vergleiche die Länge des Originaltexts und der Zusammenfassung.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")

# Summarize the text
summary_text = ____(original_text)

# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")
Code bearbeiten und ausführen