1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ensemble Methods in Python

Connected

Bài tập

Huấn luyện với bootstrapping

Bây giờ, hãy xây dựng một bộ phân loại cây quyết định "yếu" và huấn luyện nó trên một mẫu của tập huấn luyện được rút ra có hoàn lại (with replacement). Điều này sẽ giúp bạn hiểu điều gì xảy ra ở mỗi vòng lặp của một mô hình bagging.

Để lấy mẫu, bạn sẽ dùng phương thức .sample() của pandas, trong đó có tham số replace. Ví dụ, dòng mã sau sẽ lấy mẫu có hoàn lại từ toàn bộ DataFrame df:

df.sample(frac=1.0, replace=True, random_state=42)

Hướng dẫn

100 XP
  • Lấy một mẫu có hoàn lại (replace=True) từ toàn bộ (frac=1.0) tập huấn luyện X_train.
  • Xây dựng một bộ phân loại cây quyết định với tham số max_depth = 4.
  • Fit mô hình lên dữ liệu huấn luyện đã lấy mẫu.