1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa Rủi ro Tín dụng bằng Python

Connected

Bài tập

Dự đoán xác suất vỡ nợ

Toàn bộ bước xử lý dữ liệu đã hoàn tất và đây là lúc bắt đầu tạo dự đoán xác suất vỡ nợ. Bạn muốn huấn luyện một mô hình LogisticRegression() trên dữ liệu và xem nó dự đoán xác suất vỡ nợ như thế nào.

Để bạn hiểu rõ hơn mô hình tạo ra gì với predict_proba, bạn nên xem một bản ghi ví dụ cùng với xác suất vỡ nợ được dự đoán. Năm dự đoán đầu tiên so với giá trị thực của loan_status trông ra sao?

Bộ dữ liệu cr_loan_prep cùng với X_train, X_test, y_train và y_test đã được nạp sẵn trong không gian làm việc.

Hướng dẫn

100 XP
  • Huấn luyện một mô hình logistic regression trên dữ liệu huấn luyện và lưu là clf_logistic.
  • Dùng predict_proba() trên dữ liệu kiểm tra để tạo dự đoán và lưu vào preds.
  • Tạo hai data frame, preds_df và true_df, để lưu 5 dự đoán đầu tiên và các giá trị loan_status thực tế tương ứng.
  • In true_df và preds_df cùng nhau bằng .concat().