1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Trộn mô hình (Model blending)

Bạn sẽ bắt đầu tạo các tổ hợp mô hình bằng kỹ thuật blending.

Mục tiêu của bạn là huấn luyện 2 mô hình khác nhau trên dữ liệu cuộc thi New York City Taxi. Thực hiện dự đoán trên dữ liệu kiểm tra rồi trộn chúng bằng trung bình cộng đơn giản.

Các DataFrame train và test đã có sẵn trong không gian làm việc của bạn. features là danh sách các cột dùng để huấn luyện và cũng đã có sẵn. Tên biến mục tiêu là "fare_amount".

Hướng dẫn

100 XP
  • Huấn luyện một mô hình Gradient Boosting trên dữ liệu train sử dụng danh sách features, và cột "fare_amount" làm biến mục tiêu.
  • Huấn luyện một mô hình Random Forest theo cách tương tự.
  • Tạo dự đoán trên dữ liệu test bằng cả mô hình Gradient Boosting và Random Forest.
  • Tính trung bình dự đoán của cả hai mô hình.