1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Dự đoán với Python

Connected

Bài tập

Xây dựng các đường cong AUC

Thuật toán chọn biến tiến dần (forward stepwise) cung cấp một thứ tự tối ưu để thêm biến vào tập biến dự báo. Để quyết định điểm dừng chọn biến, bạn có thể vẽ các đường cong AUC cho train và test. Những đường cong này biểu diễn AUC của train và test khi dùng biến đầu tiên, hai biến đầu tiên, ba biến đầu tiên, … trong mô hình.

Trong bài tập này, bạn sẽ học cách vẽ các đường cong AUC đó. Phương thức auc_train_test để tính AUC đã được cài sẵn và có thể dùng như sau:

auc_train, auc_test = auc_train_test(variables, target, train, test)

trong đó variables là tập biến dùng cho mô hình hồi quy logistic, target là danh sách chứa tên biến mục tiêu, và train cùng test lần lượt là basetable train và test.

Các biến đã được sắp xếp theo thuật toán tiến dần được cung cấp trong danh sách variables. Bạn có thể xem trong console. Ngoài ra, ba danh sách trống đã được định nghĩa sẵn cho bạn:

  • auc_values_train, sẽ chứa các giá trị AUC trên train của mô hình ở mỗi vòng lặp
  • auc_values_test, sẽ chứa các giá trị AUC trên test của mô hình ở mỗi vòng lặp
  • variables_evaluate, sẽ chứa các biến được đánh giá ở mỗi vòng lặp

Hướng dẫn

100 XP
  • Lặp qua các biến.
  • Ở mỗi vòng lặp, thêm biến kế tiếp trong variables vào variables_evaluate.
  • Ở mỗi vòng lặp, tính AUC của train và test bằng phương thức auc_train_test. Các DataFrame train và test lần lượt chứa dữ liệu train và test.
  • Ở mỗi vòng lặp, thêm các giá trị tính được vào auc_values_train và auc_values_test