Dasar-dasar logistic regression
Anda kini telah membersihkan data dan membuat himpunan data baru cr_loan_clean.
Ingat kembali scatter plot terakhir dari bab 1 yang menunjukkan lebih banyak gagal bayar pada loan_int_rate yang tinggi. Suku bunga mudah dipahami, tetapi seberapa berguna variabel ini untuk memprediksi probability of default?
Karena Anda belum mencoba memprediksi probability of default, uji dengan membuat dan melatih model logistic regression hanya dengan loan_int_rate. Periksa juga parameter internal model, yang mirip dengan pengaturan, untuk melihat struktur model dengan satu kolom ini.
Data cr_loan_clean telah dimuat di ruang kerja.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Buat himpunan
Xdanymenggunakan kolomloan_int_ratedanloan_status. - Buat dan latih model logistic regression pada data pelatihan dan beri nama
clf_logistic_single. - Cetak parameter model dengan
.get_params(). - Periksa intersep model dengan atribut
.intercept_.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the X and y data sets
X = ____[[____]]
y = ____[[____]]
# Create and fit a logistic regression model
____ = ____()
clf_logistic_single.____(X, np.ravel(____))
# Print the parameters of the model
print(____.____())
# Print the intercept of the model
print(____.____)