MulaiMulai sekarang secara gratis

Membuat himpunan pelatihan dan uji

Anda baru saja melatih model LogisticRegression() pada berbagai kolom.

Anda tahu bahwa data harus dipisahkan menjadi himpunan pelatihan dan uji. test_train_split() digunakan untuk membuat keduanya secara bersamaan. Himpunan pelatihan digunakan untuk membuat prediksi, sedangkan himpunan uji digunakan untuk evaluasi. Tanpa mengevaluasi model, Anda tidak punya cara untuk mengetahui seberapa baik kinerjanya pada data pinjaman baru.

Selain intercept_, yang merupakan atribut model, model LogisticRegression() juga memiliki atribut .coef_. Ini menunjukkan seberapa penting setiap kolom pelatihan untuk memprediksi probability of default.

Himpunan data cr_loan_clean sudah dimuat di workspace.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat himpunan data X menggunakan suku bunga, lama masa kerja, dan pendapatan. Buat himpunan y menggunakan status pinjaman.
  • Gunakan train_test_split() untuk membuat himpunan pelatihan dan uji dari X dan y.
  • Buat dan latih model LogisticRegression() dan simpan sebagai clf_logistic.
  • Cetak koefisien model menggunakan .coef_.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the X and y data sets
X = ____[[____,____,____]]
y = ____[[____]]

# Use test_train_split to create the training and test sets
X_train, X_test, y_train, y_test = ____(____, ____, test_size=.4, random_state=123)

# Create and fit the logistic regression model
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Print the models coefficients
print(____.coef_)
Edit dan Jalankan Kode