1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán nâng cao với Python

Connected

Bài tập

Vi phạm mốc thời gian

Để minh họa tầm quan trọng của trục thời gian, hãy xem một ví dụ bạn vi phạm mốc thời gian khi dùng thông tin từ giai đoạn mục tiêu để xây dựng các biến dự báo.

Có hai cột trong pandas dataframe basetable: "amount_2017" là tổng số tiền quyên góp trong năm 2017, và "target" bằng 1 nếu tổng này lớn hơn 30, ngược lại là 0.

Hãy xây dựng một mô hình hồi quy logistic sử dụng "amount_2017" làm biến dự báo duy nhất để dự đoán biến đích, và tính AUC.

Hướng dẫn

100 XP
  • Tạo dataframe X chứa biến dự báo và dataframe y chứa biến đích.
  • Huấn luyện mô hình hồi quy logistic sao cho y được dự đoán từ X. Xây dựng mô hình hồi quy logistic sử dụng amount_2017 làm biến dự báo duy nhất để dự đoán target.
  • Tạo dự đoán cho các đối tượng trong X.
  • Tính và in ra AUC của mô hình này bằng hàm roc_auc_score.