1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning from Human Feedback (RLHF)

Connected

Bài tập

Triển khai một pipeline active learning

Trong bài tập này, bạn sẽ thiết lập một active learner sử dụng mô hình logistic regression và chiến lược uncertainty sampling.

Bộ dữ liệu đã được nạp với X_labeled cho dữ liệu huấn luyện đã gán nhãn, X_unlabeled cho dữ liệu huấn luyện chưa gán nhãn, và y_labeled cho nhãn.

Các thư viện cần thiết đã được nhập: ActiveLearner từ modAL.models, uncertainty_sampling từ modAL.uncertainty và LogisticRegression từ sklearn.linear_model.

Hướng dẫn

100 XP
  • Khởi tạo một đối tượng ActiveLearner.
  • Dùng LogisticRegression làm estimator.
  • Dùng uncertainty sampling làm query strategy.
  • Khởi tạo learner với dữ liệu huấn luyện đã gán nhãn.