1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

Bài tập

Tinh chỉnh thực tế

Các siêu tham số tốt nhất sẽ tạo ra mô hình tốt nhất cho dữ liệu của bạn. Khi đã quyết định lưới tinh chỉnh, bạn cần huấn luyện và đánh giá mô hình tại từng điểm trong lưới để xem điểm nào cho hiệu năng tốt nhất.

Việc này có thể tốn thời gian, vì với k-fold cross-validation, kích thước ensemble là n cây, và lưới tinh chỉnh có t kết hợp, tổng số mô hình cần huấn luyện sẽ là k * n * t.

Đến lượt bạn thực hiện tinh chỉnh thực tế! Đã nạp sẵn customers_train và kết quả từ bài trước, boost_spec và tunegrid_boost:

# A tibble: 27 x 3
   tree_depth    learn_rate  sample_size
        <int>         <dbl>        <dbl>
 1          1  0.0000000001         0.1 
 2          8  0.0000000001         0.1 
 3         15  0.0000000001         0.1 
 4          1  0.00000316           0.1 
 ...

Hướng dẫn

100 XP
  • Tạo 6 fold từ dữ liệu huấn luyện bằng vfold_cv() và lưu thành folds.
  • Dùng tune_grid() để tinh chỉnh boost_spec với các fold của bạn, lưới tinh chỉnh của bạn, và metric roc_auc. Lưu kết quả thành tune_results.
  • Vẽ biểu đồ kết quả để trực quan hóa quá trình tinh chỉnh.