1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

Bài tập

Fine-tuning để phân loại đánh giá

Dự án của bạn tiếp tục và bây giờ bạn muốn phân loại các đánh giá thành tích cực, trung tính hoặc tiêu cực. Bạn sẽ dùng một mô hình đã fine-tune để tự động phân loại các đánh giá.

Các lớp TrainingArguments và Trainer đã được import từ transformers. training_args, model, và tokenized_datasets cũng đã được import sẵn.

Hướng dẫn

100 XP
  • Tạo các tập dữ liệu train và test bằng các tập con "train" và "test" từ tập tokenized_datasets.
  • Khởi tạo lớp trainer.
  • Thêm các tham số huấn luyện vào lớp.