Generasi teks dengan RLHF
Dalam latihan ini, Anda akan bekerja dengan model yang telah dilatih awal menggunakan RLHF bernama lvwerra/gpt2-imdb-pos-v2. Latihan ini merupakan kesempatan untuk meninjau cara membangun pipeline Hugging Face dan menggunakannya untuk menguji salah satu kasus penggunaan model terlatih RLHF: menghasilkan ulasan film.
Objek pipeline, AutoModelForCausalLM, and AutoTokenizer telah diimpor sebelumnya dari transformers. tokenizer telah dimuat sebelumnya
Latihan ini adalah bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Petunjuk latihan
- Atur nama model ke
lvwerra/gpt2-imdb-pos-v2, model yang telah dilatih awal dengan RLHF. - Gunakan fungsi
pipelineuntuk membuat pipelinetext-generation. - Gunakan pipeline generasi teks untuk menghasilkan kelanjutan dari ulasan yang disediakan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Set the model name
model_name = ____
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
# Create a text generation pipeline
text_generator = pipeline(____, model=model, tokenizer=tokenizer)
review_prompt = "Surprisingly, the film"
# Generate a continuation of the review
generated_text = text_generator(____, max_length=10)
print(f"Generated Review Continuation: {generated_text[0]['generated_text']}")