1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa Rủi ro Tín dụng bằng Python

Connected

Bài tập

Tầm quan trọng của cột và dự đoán vỡ nợ

Khi dùng nhiều tập huấn luyện với nhiều nhóm cột khác nhau, bạn cần để ý cột nào thực sự quan trọng và cột nào thì không. Việc duy trì một tập cột có thể tốn kém hoặc mất thời gian, nhất là khi chúng không ảnh hưởng gì đến loan_status.

Dữ liệu X cho bài này được tạo bằng đoạn mã sau:

X = cr_loan_prep[['person_income','loan_int_rate',
                  'loan_percent_income','loan_amnt',
                  'person_home_ownership_MORTGAGE','loan_grade_F']]

Huấn luyện một mô hình XGBClassifier() trên dữ liệu này và kiểm tra độ quan trọng của cột để xem mỗi cột đóng góp thế nào trong việc dự đoán loan_status.

Bộ dữ liệu cr_loan_pret cùng với X_train và y_train đã được nạp sẵn trong không gian làm việc.

Hướng dẫn

100 XP
  • Tạo và huấn luyện mô hình XGBClassifier() trên các tập huấn luyện X_train và y_train, lưu vào clf_gbt.
  • In độ quan trọng của các cột trong clf_gbt bằng cách dùng .get_booster() và .get_score().