Generasi teks dengan RLHF
Dalam latihan ini, Anda akan bekerja dengan model yang telah dilatih awal menggunakan RLHF bernama lvwerra/gpt2-imdb-pos-v2. Latihan ini merupakan kesempatan untuk meninjau cara membangun pipeline Hugging Face dan menggunakannya untuk menguji salah satu kasus penggunaan model terlatih RLHF: menghasilkan ulasan film.
Objek pipeline, AutoModelForCausalLM, and AutoTokenizer telah diimpor sebelumnya dari transformers. tokenizer telah dimuat sebelumnya
Latihan ini merupakan bagian dari kursus
Reinforcement Learning from Human Feedback (RLHF)
Instruksi latihan
- Atur nama model ke
lvwerra/gpt2-imdb-pos-v2, model yang telah dilatih awal dengan RLHF. - Gunakan fungsi
pipelineuntuk membuat pipelinetext-generation. - Gunakan pipeline generasi teks untuk menghasilkan kelanjutan dari ulasan yang disediakan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Set the model name
model_name = ____
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
# Create a text generation pipeline
text_generator = pipeline(____, model=model, tokenizer=tokenizer)
review_prompt = "Surprisingly, the film"
# Generate a continuation of the review
generated_text = text_generator(____, max_length=10)
print(f"Generated Review Continuation: {generated_text[0]['generated_text']}")