1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa Rủi ro Tín dụng bằng Python

Connected

Bài tập

Tạo tập huấn luyện và tập kiểm tra

Bạn vừa huấn luyện các mô hình LogisticRegression() trên những cột khác nhau.

Bạn biết rằng dữ liệu cần được tách thành tập huấn luyện và tập kiểm tra. test_train_split() được dùng để tạo cả hai cùng lúc. Tập huấn luyện được dùng để huấn luyện mô hình tạo dự đoán, trong khi tập kiểm tra được dùng để đánh giá. Nếu không đánh giá mô hình, bạn sẽ không biết nó hoạt động thế nào trên dữ liệu khoản vay mới.

Bên cạnh intercept_ là một thuộc tính của mô hình, các mô hình LogisticRegression() cũng có thuộc tính .coef_. Thuộc tính này cho thấy tầm quan trọng của từng cột huấn luyện trong việc dự đoán xác suất vỡ nợ.

Bộ dữ liệu cr_loan_clean đã được nạp sẵn trong không gian làm việc.

Hướng dẫn

100 XP
  • Tạo tập dữ liệu X sử dụng lãi suất, số năm làm việc và thu nhập. Tạo tập y sử dụng trạng thái khoản vay.
  • Dùng train_test_split() để tạo các tập huấn luyện và kiểm tra từ X và y.
  • Tạo và huấn luyện một mô hình LogisticRegression() và lưu vào clf_logistic.
  • In các hệ số của mô hình bằng .coef_.