Özet uzunluğunu ayarlama
pipeline() fonksiyonunun iki önemli parametresi vardır: min_new_tokens ve max_new_tokens. Bunlar, ortaya çıkan özet metnin kısa, daha uzun veya belirli bir kelime/simge sayısı aralığında olmasını ayarlamak için kullanışlıdır. Bunu, alan kısıtları (ör. küçük depolama), okunabilirliği artırma veya özet kalitesini iyileştirme gibi nedenlerle yapmak isteyebilirsin.
Bu iki parametreyi önce dar, sonra daha geniş bir aralığa ayarlayarak kısa ve uzun özetleyicilerle denemeler yapacaksın.
transformers kütüphanesinden pipeline ve original_text senin için zaten yüklendi.
Bu egzersiz, kursun bir parçasıdır
Hugging Face ile Çalışmak
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Generate a summary of original_text between 1 and 10 tokens
short_summarizer = pipeline(task="summarization", model="cnicu/t5-small-booksum", ____=1, ____=10)
short_summary_text = ____(original_text)
print(short_summary_text[0]["summary_text"])