Sinh văn bản với RLHF

Trong bài tập này, bạn sẽ làm việc với một mô hình được huấn luyện sẵn bằng RLHF có tên lvwerra/gpt2-imdb-pos-v2. Đây là cơ hội để bạn ôn lại cách xây dựng một pipeline của Hugging Face và dùng nó để kiểm thử một trường hợp sử dụng của các mô hình được huấn luyện bằng RLHF: sinh bài đánh giá phim.

Các đối tượng pipeline, AutoModelForCausalLM, and AutoTokenizer đã được nhập sẵn từ transformers. tokenizer cũng đã được nạp sẵn