Meringkas teks panjang
Perangkumkan mengubah teks yang besar menjadi konten yang lebih ringkas, membantu pembaca cepat memahami poin-poin utama dari artikel atau dokumen yang panjang.
Ada dua jenis utama: ekstraktif, yang memilih kalimat-kalimat kunci dari teks asli, dan abstraktif, yang menghasilkan kalimat baru untuk merangkum gagasan utama.
Dalam latihan ini, Anda akan membuat pipeline peringkasan abstraktif menggunakan fungsi pipeline() dari Hugging Face dan model cnicu/t5-small-booksum. Anda akan meringkas teks dari halaman Wikipedia tentang Yunani, lalu membandingkan keluaran parafrasa dari model abstraktif dengan teks aslinya.
Fungsi pipeline dari pustaka transformers dan original_text sudah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Bekerja dengan Hugging Face
Petunjuk latihan
- Buat
pipelineperingkasan dengan task "summarization" dan simpan sebagaisummarizer. - Gunakan pipeline baru tersebut untuk membuat ringkasan teks dan simpan sebagai
summary_text. - Bandingkan panjang teks asli dan teks ringkasan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the summarization pipeline
summarizer = ____(____="____", model="cnicu/t5-small-booksum")
# Summarize the text
summary_text = ____(original_text)
# Compare the length
print(f"Original text length: {len(original_text)}")
print(f"Summary length: {len(____[0]['____'])}")