1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Áp dụng stacking để dự đoán xếp hạng ứng dụng

Trong bài tập này, bạn sẽ bắt đầu xây dựng Stacking ensemble đầu tiên. Bộ dữ liệu bạn dùng chính là bộ đầu tiên ở Chương 1. Như bạn nhớ, mục tiêu là dự đoán xếp hạng của mỗi ứng dụng (từ 1 đến 5). Các đặc trưng đầu vào gồm: Reviews, Size, Installs, Type, Price, và Content Rating.

Chúng tôi đã thực hiện sẵn bước 1: chuẩn bị dữ liệu. Dữ liệu có sẵn dưới tên apps. Chúng tôi đã làm sạch các đặc trưng cần thiết và thay thế giá trị thiếu bằng 0.

Bây giờ, bạn sẽ làm bước 2: xây dựng các bộ ước lượng tầng thứ nhất.

Hướng dẫn

100 XP
  • Xây dựng và fit một decision tree classifier với: min_samples_leaf: 3 và min_samples_split: 9.
  • Xây dựng và fit một 5-nearest neighbors classifier dùng: algorithm: 'ball_tree' (để tăng tốc xử lý).
  • Đánh giá hiệu năng của từng bộ ước lượng bằng accuracy score trên tập kiểm tra.