1. Learn
  2. /
  3. Courses
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Exercise

Vượt ra ngoài mỗi độ chính xác

Trong bài tập này, để không chỉ dừng ở độ chính xác, bạn sẽ đánh giá AUC của đường cong ROC cho một mô hình cây quyết định cơ bản. Hãy nhớ rằng mốc so sánh cho một bộ phân loại ngẫu nhiên là AUC bằng 0.5, nên bạn cần đạt điểm cao hơn 0.5.

X là DataFrame chứa các đặc trưng và y là DataFrame chứa giá trị mục tiêu. Cả sklearn và pandas với bí danh pd đều có sẵn trong môi trường làm việc của bạn.

Chúng ta sẽ dùng thiết lập này để xem AUC của đường cong ROC.

Instructions

100 XP
  • Chia dữ liệu thành tập huấn luyện và tập kiểm tra.
  • Huấn luyện bộ phân loại trên dữ liệu huấn luyện, rồi tạo dự đoán cho dữ liệu kiểm tra bằng predict_proba() và predict().
  • Đánh giá AUC dưới đường cong ROC bằng hàm roc_curve() trên y_test qua roc_curve(y_test, y_score[:, 1]).