1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Cây quyết định bị giới hạn và không bị giới hạn

Trong bài này, chúng ta sẽ quay lại bộ dữ liệu Pokémon từ chương trước. Nhắc lại: mục tiêu là dự đoán một Pokémon bất kỳ có phải là huyền thoại (legendary) hay không.

Ở đây, bạn sẽ xây dựng hai mô hình phân loại bằng cây quyết định. Ở mô hình thứ nhất, bạn chỉ định các tham số min_samples_leaf và min_samples_split, nhưng không giới hạn độ sâu tối đa, để cây có thể phát triển hoàn toàn không bị ràng buộc.

Ở mô hình thứ hai, bạn sẽ áp đặt một số ràng buộc bằng cách giới hạn độ sâu của cây quyết định. Bằng cách so sánh hai mô hình, bạn sẽ hiểu rõ hơn khái niệm về một bộ học "yếu" (weak learner).

Hướng dẫn 1/2

undefined XP
  • 1

    Xây dựng một cây quyết định không bị giới hạn với các tham số min_samples_leaf=3, min_samples_split=9, và random_state=500.

  • 2

    Xây dựng một cây bị giới hạn bằng cách thay min_samples_leaf và min_samples_split bằng max_depth=4 và max_features=2.