1. 学习
  2. /
  3. 课程
  4. /
  5. Tinh chỉnh siêu tham số trong Python

Connected

练习

Trích xuất một tham số của Random Forest

Bây giờ bạn sẽ chuyển phần công việc đã làm với mô hình logistic regression sang mô hình random forest. Một tham số của mô hình này là, với mỗi cây, cách nó quyết định tách (split) ở mỗi mức.

Phân tích này không hữu ích bằng các hệ số của logistic regression, vì bạn hầu như sẽ không thể khám phá mọi lần chia và mọi cây trong một mô hình random forest. Tuy vậy, đây là một bài tập rất hữu ích để "ngó" vào bên trong xem mô hình đang làm gì.

Trong bài tập này, chúng ta sẽ trích xuất một cây đơn từ mô hình random forest, trực quan hóa nó và trích xuất theo lập trình một trong các lần chia.

Bạn có sẵn:

  • Một đối tượng mô hình random forest, rf_clf
  • Một ảnh phần đỉnh của cây quyết định đã chọn, tree_viz_image
  • DataFrame X_train và danh sách original_variables

说明

100 XP
  • Trích xuất cây thứ 7 (chỉ số 6) từ mô hình random forest.
  • Trực quan hóa cây này (tree_viz_image) để xem các quyết định chia.
  • Trích xuất đặc trưng và ngưỡng (level) của lần chia ở đỉnh.
  • In ra đặc trưng và ngưỡng cùng nhau.