1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

Bài tập

Nhận diện nguồn dữ liệu không đáng tin cậy

Nhóm của bạn đang phát triển một mô hình hỗ trợ tạo báo cáo chính xác trong ngành an toàn ô tô. Bạn đã thu thập dữ liệu sở thích từ ba nguồn dữ liệu — "GlobalDrive Safety Institute", "AutoTech Safety Alliance" và "QuickScan Auto Review". Gần đây, có những lo ngại về tính toàn vẹn của dữ liệu, và bạn được yêu cầu đánh giá để xác định bất kỳ nguồn dữ liệu nào không đáng tin cậy.

automotive_df là một DataFrame tổng hợp được nạp bằng thư viện pandas đã nhập sẵn. Nó chứa dữ liệu từ cả ba nguồn. Hàm majority_vote đã nhập sẵn tạo ra một đối tượng giống từ điển với cặp (chosen, rejected) theo đa số cho mỗi 'id'.

Hướng dẫn

100 XP
  • Xác định điều kiện để đếm một trường hợp bất đồng với kết quả bỏ phiếu đa số cho một nguồn dữ liệu nhất định.