1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giám sát Machine Learning bằng Python

Connected

Bài tập

Thống kê tóm tắt

Hãy nhớ từ bài học trước rằng NannyML cung cấp năm phương pháp để theo dõi các thay đổi thống kê trong các đặc trưng của bạn.

Trong bài tập này, bạn sẽ tập trung kiểm tra đặc trưng lead_time từ bộ dữ liệu Hotel Booking, cho biết số ngày đặt phòng trước. Bằng cách sử dụng các thống kê tổng, trung vị, và độ lệch chuẩn, bạn có thể rút ra những hiểu biết giá trị về cách hành vi đặt phòng của khách hàng đã thay đổi theo thời gian.

Lưu ý rằng cả tập tham chiếu và tập phân tích, cũng như thư viện nannyml, đều đã được nạp sẵn và sẵn sàng sử dụng.

Hướng dẫn 1/3

undefined XP
  • 1
    • Đặt cột cần phân tích là lead time, khởi tạo SummaryStatsSumCalculator, truyền analyzed_column vào tham số column names.
  • 2
    • Khởi tạo SummaryStatsMedianCalculator, truyền analyzed_column vào tham số column names, lọc kết quả chỉ cho giai đoạn phân tích.
  • 3
    • Khởi tạo SummaryStatsStdCalculator.