Pelaporan klasifikasi gagal bayar
Sekarang saatnya meninjau lebih dekat evaluasi model. Di sinilah penetapan ambang untuk probability of default akan membantu Anda menganalisis kinerja model melalui pelaporan klasifikasi.
Membuat data frame berisi probabilitas akan memudahkan pengolahan, karena Anda dapat memanfaatkan seluruh kemampuan pandas. Terapkan ambang pada data dan periksa value counts untuk kedua kelas loan_status guna melihat berapa banyak prediksi yang dihasilkan untuk masing-masing. Ini akan membantu memberikan wawasan terhadap skor dalam classification report.
Himpunan data cr_loan_prep, model logistic regression terlatih clf_logistic, nilai status pinjaman sebenarnya y_test, dan probabilitas yang diprediksi, preds, sudah dimuat di workspace.
Latihan ini merupakan bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Instruksi latihan
- Buat data frame yang hanya berisi probability of default dari
predsbernamapreds_df. - Tetapkan ulang nilai
loan_statusberdasarkan ambang0.50untuk probability of default dipreds_df. - Cetak value counts jumlah baris untuk tiap
loan_status. - Cetak classification report menggunakan
y_testdanpreds_df.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))