1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Chinh phục cuộc thi Kaggle bằng Python

Connected

Bài tập

Xếp chồng mô hình I

Giờ là lúc thực hành stacking. Để triển khai phương pháp stacking, bạn sẽ làm theo 6 bước đã thảo luận trong video trước:

  1. Chia dữ liệu train thành hai phần
  2. Huấn luyện nhiều mô hình trên Phần 1
  3. Tạo dự đoán trên Phần 2
  4. Tạo dự đoán trên dữ liệu test
  5. Huấn luyện mô hình mới trên Phần 2, dùng các dự đoán làm đặc trưng
  6. Tạo dự đoán trên dữ liệu test bằng mô hình cấp độ 2

Các DataFrame train và test đã có sẵn trong môi trường làm việc của bạn. features là danh sách các cột sẽ dùng để huấn luyện trên dữ liệu Phần 1 và cũng đã có sẵn. Tên biến mục tiêu là "fare_amount".

Hướng dẫn 1/2

undefined XP
    1
    2
  • Chia DataFrame train thành hai phần bằng nhau: part_1 và part_2. Dùng hàm train_test_split() với test_size bằng 0.5.
  • Huấn luyện các mô hình Gradient Boosting và Random Forest trên dữ liệu part_1.