1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Xếp chồng mô hình II

Đến giờ, những gì bạn đã làm trong quy trình stacking:

  1. Chia dữ liệu train thành hai phần
  2. Huấn luyện nhiều mô hình trên Phần 1
  3. Tạo dự đoán trên Phần 2
  4. Tạo dự đoán trên dữ liệu test

Giờ mục tiêu của bạn là tạo một mô hình tầng thứ hai, sử dụng các dự đoán từ bước 3 và 4 làm đặc trưng. Nghĩa là mô hình này được huấn luyện trên dữ liệu Phần 2, rồi bạn có thể tạo dự đoán stacking trên dữ liệu test.

Các DataFrame part_2 và test đã có sẵn trong không gian làm việc của bạn. Các dự đoán của Gradient Boosting và Random Forest được lưu trong các DataFrame này với tên lần lượt là "gb_pred" và "rf_pred".

Hướng dẫn

100 XP
  • Huấn luyện một mô hình Linear Regression trên dữ liệu Phần 2, sử dụng các dự đoán của mô hình Gradient Boosting và Random Forest làm đặc trưng.
  • Tạo dự đoán trên dữ liệu test, sử dụng các dự đoán của mô hình Gradient Boosting và Random Forest làm đặc trưng.