1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với mô hình dựa trên cây trong Python

Connected

Bài tập

Tìm kiếm rừng tối ưu

Trong bài tập này, bạn sẽ thực hiện grid search với cross validation 3-fold để tìm các siêu tham số tối ưu của rf. Để đánh giá từng mô hình trong lưới, bạn sẽ dùng chỉ số negative mean squared error.

Lưu ý rằng vì grid search là một quá trình tìm kiếm vét cạn, việc huấn luyện mô hình có thể mất nhiều thời gian. Ở đây bạn chỉ khởi tạo đối tượng GridSearchCV mà không fit nó với tập huấn luyện. Như đã đề cập trong video, bạn có thể huấn luyện đối tượng này tương tự như bất kỳ estimator nào của scikit-learn bằng phương thức .fit():

grid_object.fit(X_train, y_train)

Mô hình random forests regressor chưa tinh chỉnh rf cũng như dictionary params_rf mà bạn đã định nghĩa ở bài trước đã có sẵn trong workspace của bạn.

Hướng dẫn

100 XP
  • Import GridSearchCV từ sklearn.model_selection.

  • Khởi tạo một đối tượng GridSearchCV dùng cross validation 3-fold với thước đo đánh giá là negative mean squared error.