MulaiMulai sekarang secara gratis

Generasi teks dengan RLHF

Dalam latihan ini, Anda akan bekerja dengan model yang telah dilatih awal menggunakan RLHF bernama lvwerra/gpt2-imdb-pos-v2. Latihan ini merupakan kesempatan untuk meninjau cara membangun pipeline Hugging Face dan menggunakannya untuk menguji salah satu kasus penggunaan model terlatih RLHF: menghasilkan ulasan film.

Objek pipeline, AutoModelForCausalLM, and AutoTokenizer telah diimpor sebelumnya dari transformers. tokenizer telah dimuat sebelumnya

Latihan ini adalah bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Petunjuk latihan

  • Atur nama model ke lvwerra/gpt2-imdb-pos-v2, model yang telah dilatih awal dengan RLHF.
  • Gunakan fungsi pipeline untuk membuat pipeline text-generation.
  • Gunakan pipeline generasi teks untuk menghasilkan kelanjutan dari ulasan yang disediakan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Set the model name
model_name = ____
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Create a text generation pipeline
text_generator = pipeline(____, model=model, tokenizer=tokenizer)

review_prompt = "Surprisingly, the film"

# Generate a continuation of the review
generated_text = text_generator(____, max_length=10)
print(f"Generated Review Continuation: {generated_text[0]['generated_text']}")
Edit dan Jalankan Kode