1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giám sát Machine Learning bằng Python

Connected

Bài tập

Drift trong bộ dữ liệu đặt phòng khách sạn

Ở chương trước, bạn đã tính giá trị kinh doanh và hiệu năng ROC AUC cho một mô hình dự đoán hủy đặt phòng. Bạn đã thấy một vài cảnh báo trên các biểu đồ kết quả, vì vậy bạn cần kiểm tra xem có drift trong dữ liệu phân tích hay không.

Trong bài tập này, bạn sẽ khởi tạo phương pháp phát hiện drift đa biến và so sánh kết quả của nó với kết quả hiệu năng đã tính ở chương trước.

StandardDeviationThreshold đã được nhập sẵn cùng với giá trị kinh doanh và kết quả ROC AUC được lưu trong biến perf_results, và feature_column_names cũng đã được định nghĩa.

Hướng dẫn

100 XP
  • Khởi tạo phương pháp StandardDeviationThreshold và đặt std_lower_multiplier là 2 và std_upper_multiplier là 1.
  • Thêm các tên đặc trưng sau: country, lead_time, parking_spaces, và hotel. Giữ nguyên thứ tự này.
  • Truyền các ngưỡng và tên đặc trưng đã định nghĩa trước đó vào DataReconstructionDriftCalculator.
  • Hiển thị biểu đồ so sánh bao gồm cả kết quả phát hiện drift đa biến (mv_results) và kết quả hiệu năng (perf_results).