1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

Bài tập

Đánh giá RLHF bằng các thước đo

Bạn đang huấn luyện một mô hình bằng Reinforcement Learning with Human Feedback (RLHF) và cần đánh giá hiệu năng của nó bằng các thước đo phù hợp.

Trong các lựa chọn sau, phương án nào phù hợp nhất để đánh giá một nhiệm vụ tóm tắt bằng thước đo tự động?

Bạn có thể trực quan hóa dữ liệu trong bảng điều khiển để quyết định thước đo nào phù hợp nhất cho nhiệm vụ. Dữ liệu cần đánh giá đã được nạp sẵn dưới dạng DataFrame tên là df_evaluation.

Hướng dẫn

50 XP

Các phương án trả lời