1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning với Mô hình Dựa trên Cây trong R

Connected

Bài tập

So sánh AUC

So sánh các mô hình khác nhau là trọng tâm của việc chọn mô hình. Trong hai bài tập cuối, bạn sẽ so sánh các mô hình thuộc tất cả các loại đã học trong khóa này: cây quyết định, bagging (cây gom mẫu), rừng ngẫu nhiên và gradient boosting.

Tất cả các mô hình đều đã được tinh chỉnh tối ưu và huấn luyện trên cùng một tập huấn luyện customers_train, sau đó dự đoán cho tập customers_test. Kết quả là các xác suất số và có sẵn trong phiên làm việc của bạn dưới tên preds_combined:

tibble [1,011 × 5]
 $ preds_tree    : 0.144 0.441 ...
 $ preds_bagging : 0.115 0.326 ...
 $ preds_forest  : 0 0 0 0.286 ...
 $ preds_boosting: 0.136 0.149 ...
 $ still_customer: "no","no", ...

Hướng dẫn 1/3

undefined XP
  • 1
    • Tính AUC cho từng cột dự đoán trong preds_combined, luôn dùng still_customer làm cột nhãn thật (truth).
  • 2
    • Gộp các kết quả vào một tibble duy nhất.
  • 3
    • Sửa mã để các đối số truyền vào bind_rows() được đặt tên là decision_tree, bagged_tree, random_forest, và boosted_tree.