MulaiMulai sekarang secara gratis

Memprediksi probabilitas gagal bayar

Seluruh pemrosesan data telah selesai dan saatnya mulai membuat prediksi untuk probabilitas gagal bayar. Anda ingin melatih model LogisticRegression() pada data, dan melihat bagaimana model tersebut memprediksi probabilitas gagal bayar.

Agar Anda lebih memahami keluaran model dengan predict_proba, Anda perlu melihat satu contoh rekaman berdampingan dengan probabilitas gagal bayar yang diprediksi. Bagaimana tampilan lima prediksi pertama dibandingkan dengan nilai aktual loan_status?

Himpunan data cr_loan_prep beserta X_train, X_test, y_train, dan y_test telah dimuat di workspace.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Petunjuk latihan

  • Latih model logistic regression pada data latih dan simpan sebagai clf_logistic.
  • Gunakan predict_proba() pada data uji untuk membuat prediksi dan simpan dalam preds.
  • Buat dua data frame, preds_df dan true_df, untuk menyimpan lima prediksi pertama dan nilai loan_status yang sebenarnya.
  • Cetak true_df dan preds_df sebagai satu set menggunakan .concat().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Train the logistic regression model on the training data
____ = ____(solver='lbfgs').____(____, np.ravel(____))

# Create predictions of probability for loan status using test data
____ = clf_logistic.____(____)

# Create dataframes of first five predictions, and first five true labels
____ = pd.DataFrame(____[:,1][0:5], columns = ['prob_default'])
____ = y_test.____()

# Concatenate and print the two data frames for comparison
print(pd.____([true_df.reset_index(drop = True), preds_df], axis = 1))
Edit dan Jalankan Kode