Pelaporan klasifikasi gagal bayar
Sekarang saatnya meninjau lebih dekat evaluasi model. Di sinilah penetapan ambang untuk probability of default akan membantu Anda menganalisis kinerja model melalui pelaporan klasifikasi.
Membuat data frame berisi probabilitas akan memudahkan pengolahan, karena Anda dapat memanfaatkan seluruh kemampuan pandas. Terapkan ambang pada data dan periksa value counts untuk kedua kelas loan_status guna melihat berapa banyak prediksi yang dihasilkan untuk masing-masing. Ini akan membantu memberikan wawasan terhadap skor dalam classification report.
Himpunan data cr_loan_prep, model logistic regression terlatih clf_logistic, nilai status pinjaman sebenarnya y_test, dan probabilitas yang diprediksi, preds, sudah dimuat di workspace.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Buat data frame yang hanya berisi probability of default dari
predsbernamapreds_df. - Tetapkan ulang nilai
loan_statusberdasarkan ambang0.50untuk probability of default dipreds_df. - Cetak value counts jumlah baris untuk tiap
loan_status. - Cetak classification report menggunakan
y_testdanpreds_df.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))