Membuat himpunan pelatihan dan uji
Anda baru saja melatih model LogisticRegression() pada berbagai kolom.
Anda tahu bahwa data harus dipisahkan menjadi himpunan pelatihan dan uji. test_train_split() digunakan untuk membuat keduanya secara bersamaan. Himpunan pelatihan digunakan untuk membuat prediksi, sedangkan himpunan uji digunakan untuk evaluasi. Tanpa mengevaluasi model, Anda tidak punya cara untuk mengetahui seberapa baik kinerjanya pada data pinjaman baru.
Selain intercept_, yang merupakan atribut model, model LogisticRegression() juga memiliki atribut .coef_. Ini menunjukkan seberapa penting setiap kolom pelatihan untuk memprediksi probability of default.
Himpunan data cr_loan_clean sudah dimuat di workspace.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Buat himpunan data
Xmenggunakan suku bunga, lama masa kerja, dan pendapatan. Buat himpunanymenggunakan status pinjaman. - Gunakan
train_test_split()untuk membuat himpunan pelatihan dan uji dariXdany. - Buat dan latih model
LogisticRegression()dan simpan sebagaiclf_logistic. - Cetak koefisien model menggunakan
.coef_.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the X and y data sets
X = ____[[____,____,____]]
y = ____[[____]]
# Use test_train_split to create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=.4, random_state=123)
# Create and fit the logistic regression model
____ = ____(solver='lbfgs').____(____, np.ravel(____))
# Print the models coefficients
print(____.coef_)