1. Lära sig
  2. /
  3. Courses
  4. /
  5. Machine Learning với mô hình dựa trên cây trong Python

Connected

exercise

Tìm cây tối ưu

Trong bài tập này, bạn sẽ thực hiện grid search với cross validation 5-fold để tìm siêu tham số tối ưu cho dt. Lưu ý rằng vì grid search là một quy trình vét cạn, việc huấn luyện mô hình có thể mất nhiều thời gian. Ở đây bạn chỉ khởi tạo đối tượng GridSearchCV mà chưa fit với tập huấn luyện. Như đã nói trong video, bạn có thể huấn luyện đối tượng này tương tự như mọi estimator của scikit-learn bằng phương thức .fit():

grid_object.fit(X_train, y_train)

Một cây phân loại chưa tinh chỉnh dt và cả dictionary params_dt mà bạn đã định nghĩa ở bài trước đều đã có trong workspace của bạn.

Instruktioner

100 XP
  • Import GridSearchCV từ sklearn.model_selection.

  • Khởi tạo một đối tượng GridSearchCV dùng CV 5-fold bằng cách thiết lập các tham số:

    • estimator là dt, param_grid là params_dt và

    • scoring là 'roc_auc'.