BaşlayınÜcretsiz Başlayın

RLHF ile metin üretimi

Bu egzersizde, RLHF ile önceden eğitilmiş lvwerra/gpt2-imdb-pos-v2 adlı bir modelle çalışacaksın. Bu egzersiz, bir Hugging Face pipeline'ı kurmayı gözden geçirmek ve RLHF ile eğitilmiş modeller için bir kullanım senaryosunu denemek için bir fırsat: film yorumları üretme.

pipeline, AutoModelForCausalLM, and AutoTokenizer nesneleri transformers paketinden önceden içe aktarılmıştır. tokenizer önceden yüklenmiştir

Bu egzersiz

İnsan Geri Bildiriminden Pekiştirmeli Öğrenme (RLHF)

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Model adını RLHF ile önceden eğitilmiş model olan lvwerra/gpt2-imdb-pos-v2 olarak ayarla.
  • pipeline fonksiyonunu kullanarak bir text-generation pipeline'ı oluştur.
  • Sağlanan incelemenin devamını üretmek için metin üretim pipeline'ını kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Set the model name
model_name = ____
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Create a text generation pipeline
text_generator = pipeline(____, model=model, tokenizer=tokenizer)

review_prompt = "Surprisingly, the film"

# Generate a continuation of the review
generated_text = text_generator(____, max_length=10)
print(f"Generated Review Continuation: {generated_text[0]['generated_text']}")
Kodu Düzenle ve Çalıştır