Mulai sekarangMulai gratis

Generasi teks dengan RLHF

Dalam latihan ini, Anda akan bekerja dengan model yang telah dilatih awal menggunakan RLHF bernama lvwerra/gpt2-imdb-pos-v2. Latihan ini merupakan kesempatan untuk meninjau cara membangun pipeline Hugging Face dan menggunakannya untuk menguji salah satu kasus penggunaan model terlatih RLHF: menghasilkan ulasan film.

Objek pipeline, AutoModelForCausalLM, and AutoTokenizer telah diimpor sebelumnya dari transformers. tokenizer telah dimuat sebelumnya

Latihan ini merupakan bagian dari kursus

Reinforcement Learning from Human Feedback (RLHF)

Lihat Kursus

Instruksi latihan

  • Atur nama model ke lvwerra/gpt2-imdb-pos-v2, model yang telah dilatih awal dengan RLHF.
  • Gunakan fungsi pipeline untuk membuat pipeline text-generation.
  • Gunakan pipeline generasi teks untuk menghasilkan kelanjutan dari ulasan yang disediakan.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Set the model name
model_name = ____
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Create a text generation pipeline
text_generator = pipeline(____, model=model, tokenizer=tokenizer)

review_prompt = "Surprisingly, the film"

# Generate a continuation of the review
generated_text = text_generator(____, max_length=10)
print(f"Generated Review Continuation: {generated_text[0]['generated_text']}")
Edit dan Jalankan Kode