1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Dự đoán cái chết trong GoT

Mặc dù biến mục tiêu không có giá trị khuyết, các đặc trưng khác thì có. Vì khóa học này không tập trung vào làm sạch và tiền xử lý dữ liệu, chúng tôi đã thực hiện sẵn các bước sau:

  • Thay thế các giá trị NA bằng 0.
  • Thay thế các giá trị âm của tuổi bằng 0.
  • Thay thế các giá trị NA của tuổi bằng giá trị trung bình.

Bây giờ, hãy xây dựng một mô hình ensemble sử dụng kỹ thuật averaging. Các mô hình riêng lẻ sau đã được xây dựng:

  • Logistic Regression (clf_lr).
  • Decision Tree (clf_dt).
  • Support Vector Machine (clf_svm).

Vì biến mục tiêu là nhị phân, tất cả các mô hình này có thể đạt hiệu suất riêng lẻ tốt. Mục tiêu của bạn là kết hợp chúng bằng averaging. Hãy nhớ từ video rằng điều này tương đương với cách tiếp cận bỏ phiếu soft, nên bạn vẫn sẽ dùng VotingClassifier().

Hướng dẫn

100 XP
  • Thiết lập danh sách các tuple (string, estimator). Dùng 'lr' cho clf_lr, 'dt' cho clf_dt, và 'svm' cho clf_svm.
  • Xây dựng một averaging classifier tên là clf_avg. Nhớ chỉ định đối số cho tham số voting.