1. Lära sig
  2. /
  3. Courses
  4. /
  5. Machine Learning với mô hình dựa trên cây trong Python

Connected

exercise

Đánh giá cây tối ưu

Trong bài này, bạn sẽ đánh giá điểm ROC AUC trên tập kiểm tra của mô hình tối ưu trong grid_dt.

Để làm điều đó, trước tiên bạn sẽ xác định xác suất nhận nhãn dương cho từng quan sát trong tập kiểm tra. Bạn có thể dùng phương thức predict_proba() của một bộ phân loại sklearn để tính một mảng 2D chứa xác suất của nhãn lớp âm và dương lần lượt theo các cột.

Bộ dữ liệu đã được nạp và xử lý sẵn cho bạn (các đặc trưng số đã được chuẩn hóa); dữ liệu được chia 80% train và 20% test. X_test, y_test đã có sẵn trong môi trường làm việc. Ngoài ra, chúng tôi cũng đã nạp đối tượng GridSearchCV đã huấn luyện là grid_dt mà bạn đã khởi tạo ở bài trước. Lưu ý rằng grid_dt đã được huấn luyện như sau:

grid_dt.fit(X_train, y_train)

Instruktioner

100 XP
  • Import roc_auc_score từ sklearn.metrics.

  • Trích xuất thuộc tính .best_estimator_ từ grid_dt và gán cho best_model.

  • Dự đoán xác suất thuộc lớp dương trên tập kiểm tra y_pred_proba.

  • Tính điểm ROC AUC trên tập kiểm tra test_roc_auc của best_model.