1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

Bài tập

K-means để phân cụm phản hồi

Bạn có một tập dữ liệu các phản hồi, và bạn đã dùng một mô hình GPT để tính điểm độ tin cậy cho từng phản hồi. Để phát hiện các phản hồi bất thường hoặc ngoại lai, bạn áp dụng phân cụm k-means cho các phản hồi có độ tin cậy thấp.

Thuật toán KMeans, các biến reviews và confidences, cùng thư viện np đã được nạp sẵn.

Hướng dẫn

100 XP
  • Khởi tạo thuật toán k-means. Đặt random_state là 42 để đảm bảo khả năng tái lập kết quả.
  • Tính khoảng cách từ các tâm cụm để xác định điểm ngoại lai bằng cách lấy hiệu giữa data và các tâm cụm tương ứng.