RLHF ile metin üretimi
Bu egzersizde, RLHF ile önceden eğitilmiş lvwerra/gpt2-imdb-pos-v2 adlı bir modelle çalışacaksın. Bu egzersiz, bir Hugging Face pipeline'ı kurmayı gözden geçirmek ve RLHF ile eğitilmiş modeller için bir kullanım senaryosunu denemek için bir fırsat: film yorumları üretme.
pipeline, AutoModelForCausalLM, and AutoTokenizer nesneleri transformers paketinden önceden içe aktarılmıştır. tokenizer önceden yüklenmiştir
Bu egzersiz
İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)
kursunun bir parçasıdırEgzersiz talimatları
- Model adını RLHF ile önceden eğitilmiş model olan
lvwerra/gpt2-imdb-pos-v2olarak ayarla. pipelinefonksiyonunu kullanarak birtext-generationpipeline'ı oluştur.- Sağlanan incelemenin devamını üretmek için metin üretim pipeline'ını kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Set the model name
model_name = ____
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
# Create a text generation pipeline
text_generator = pipeline(____, model=model, tokenizer=tokenizer)
review_prompt = "Surprisingly, the film"
# Generate a continuation of the review
generated_text = text_generator(____, max_length=10)
print(f"Generated Review Continuation: {generated_text[0]['generated_text']}")