Regresi logistik multivariat
Secara umum, Anda tidak akan hanya menggunakan loan_int_rate untuk memprediksi probabilitas gagal bayar. Anda akan ingin menggunakan semua data yang Anda miliki untuk membuat prediksi.
Dengan pemikiran ini, coba latih model baru dengan kolom berbeda, disebut fitur, dari data cr_loan_clean. Apakah model ini akan berbeda dari yang pertama? Untuk itu, Anda dapat dengan mudah memeriksa .intercept_ dari regresi logistik. Ingat bahwa ini adalah titik potong sumbu-y dari fungsi dan log-odds keseluruhan dari tidak gagal bayar.
Data cr_loan_clean telah dimuat di workspace bersama dengan model sebelumnya clf_logistic_single.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Buat himpunan data
Xbaru denganloan_int_ratedanperson_emp_length. Simpan sebagaiX_multi. - Buat himpunan data
yhanya denganloan_status. - Buat dan
.fit()modelLogisticRegression()pada dataXyang baru. Simpan sebagaiclf_logistic_multi. - Cetak nilai
.intercept_dari model
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create X data for the model
X_multi = ____[[____,____]]
# Create a set of y data for training
y = ____[[____]]
# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the intercept of the model
print(____.____)