MulaiMulai sekarang secara gratis

Regresi logistik multivariat

Secara umum, Anda tidak akan hanya menggunakan loan_int_rate untuk memprediksi probabilitas gagal bayar. Anda akan ingin menggunakan semua data yang Anda miliki untuk membuat prediksi.

Dengan pemikiran ini, coba latih model baru dengan kolom berbeda, disebut fitur, dari data cr_loan_clean. Apakah model ini akan berbeda dari yang pertama? Untuk itu, Anda dapat dengan mudah memeriksa .intercept_ dari regresi logistik. Ingat bahwa ini adalah titik potong sumbu-y dari fungsi dan log-odds keseluruhan dari tidak gagal bayar.

Data cr_loan_clean telah dimuat di workspace bersama dengan model sebelumnya clf_logistic_single.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat himpunan data X baru dengan loan_int_rate dan person_emp_length. Simpan sebagai X_multi.
  • Buat himpunan data y hanya dengan loan_status.
  • Buat dan .fit() model LogisticRegression() pada data X yang baru. Simpan sebagai clf_logistic_multi.
  • Cetak nilai .intercept_ dari model

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create X data for the model
X_multi = ____[[____,____]]

# Create a set of y data for training
y = ____[[____]]

# Create and train a new logistic regression
clf_logistic_multi = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the intercept of the model
print(____.____)
Edit dan Jalankan Kode