1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với mô hình dựa trên cây trong Python

Connected

Bài tập

Định nghĩa bộ phân loại AdaBoost

Trong các bài tập sau, bạn sẽ quay lại bộ dữ liệu Indian Liver Patient đã được giới thiệu ở chương trước. Nhiệm vụ của bạn là dự đoán liệu một bệnh nhân có mắc bệnh gan hay không dựa trên 10 đặc trưng, bao gồm Albumin, tuổi và giới tính. Tuy nhiên, lần này bạn sẽ huấn luyện một mô hình tập hợp AdaBoost để thực hiện bài toán phân loại. Thêm nữa, vì bộ dữ liệu này mất cân bằng, bạn sẽ sử dụng điểm ROC AUC làm chỉ số đánh giá thay cho accuracy.

Bước đầu tiên, bạn sẽ khởi tạo một bộ phân loại AdaBoost.

Hướng dẫn

100 XP
  • Import AdaBoostClassifier từ sklearn.ensemble.

  • Khởi tạo một DecisionTreeClassifier với max_depth đặt là 2.

  • Khởi tạo một AdaBoostClassifier gồm 180 cây và đặt base_estimator là dt.