1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Boosting để dự đoán doanh thu

Mô hình ban đầu đạt RMSE khoảng 7.34. Hãy xem liệu chúng ta có thể cải thiện điều này bằng một vòng lặp boosting.

Bạn sẽ xây dựng thêm một mô hình hồi quy tuyến tính, nhưng lần này giá trị đích là các sai số từ mô hình gốc, được tính như sau:

y_train_error = pred_train - y_train
y_test_error = pred_test - y_test

Với mô hình này, bạn sẽ dùng đặc trưng 'popularity', hy vọng rằng nó cung cấp nhiều mẫu thông tin hơn so với chỉ đặc trưng 'budget'. Dữ liệu này có sẵn dưới dạng X_train_pop và X_test_pop. Như ở bài trước, các đặc trưng đầu vào đã được chuẩn hóa sẵn cho bạn.

Hướng dẫn

100 XP
  • Fit một mô hình hồi quy tuyến tính với các sai số trước đó, dùng X_train_pop và y_train_error.
  • Tính các sai số dự đoán trên tập kiểm tra X_test_pop.
  • Tính RMSE, như ở bài trước, sử dụng y_test_error và pred_error.