1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Marketing: Dự đoán Khách hàng Rời bỏ bằng Python

Connected

Bài tập

Tinh chỉnh số lượng đặc trưng

Các siêu tham số (hyperparameter) mặc định của mô hình không được tối ưu cho dữ liệu của bạn. Mục tiêu của grid search cross-validation là tìm ra các siêu tham số giúp mô hình đạt hiệu suất tối ưu. Trong video, bạn đã thấy cách tinh chỉnh siêu tham số n_estimators của random forest. Ở đây, bạn sẽ luyện tập tinh chỉnh siêu tham số max_features. Siêu tham số cv được đặt là 3 để mã chạy nhanh.

Hyperparameter Purpose
max_features Số lượng đặc trưng dùng cho phép chia tốt nhất

Random forest là một tập hợp (ensemble) gồm nhiều decision tree. Siêu tham số n_estimators điều khiển số lượng cây trong rừng, trong khi siêu tham số max_features điều khiển số đặc trưng mà random forest sẽ xem xét khi tìm phép chia tốt nhất tại mỗi decision tree.

Một random forest classifier đã được khởi tạo sẵn cho bạn là clf.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Import GridSearchCV từ sklearn.model_selection.