1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giám sát Machine Learning bằng Python

Connected

Bài tập

Phát hiện drift univariate cho bộ dữ liệu đặt phòng khách sạn

Trong các bài trước, bạn đã dùng phương pháp phát hiện drift đa biến (multivariate) để xác định rằng sự thay đổi dữ liệu vào tháng 1 là nguyên nhân dẫn đến cảnh báo ở chỉ số ROC AUC và giá trị kinh doanh âm của mô hình.

Trong bài này, bạn sẽ dùng phương pháp phát hiện drift univariate để tìm đặc trưng (feature) và lời giải thích đằng sau hiện tượng drift.

Các tập reference và analysis đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Chỉ định phương pháp Wasserstein và Jensen-Shannon cho biến liên tục, và L-inifity và Chi2 cho biến phân loại.
  • Fit trên tập reference và tính kết quả trên tập analysis.
  • Vẽ biểu đồ kết quả.