Pelaporan klasifikasi gagal bayar

Sekarang saatnya meninjau lebih dekat evaluasi model. Di sinilah penetapan ambang untuk probability of default akan membantu Anda menganalisis kinerja model melalui pelaporan klasifikasi.

Membuat data frame berisi probabilitas akan memudahkan pengolahan, karena Anda dapat memanfaatkan seluruh kemampuan pandas. Terapkan ambang pada data dan periksa value counts untuk kedua kelas loan_status guna melihat berapa banyak prediksi yang dihasilkan untuk masing-masing. Ini akan membantu memberikan wawasan terhadap skor dalam classification report.

Himpunan data cr_loan_prep, model logistic regression terlatih clf_logistic, nilai status pinjaman sebenarnya y_test, dan probabilitas yang diprediksi, preds, sudah dimuat di workspace.

Latihan ini merupakan bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Instruksi latihan

Buat data frame yang hanya berisi probability of default dari preds bernama preds_df.
Tetapkan ulang nilai loan_status berdasarkan ambang 0.50 untuk probability of default di preds_df.
Cetak value counts jumlah baris untuk tiap loan_status.
Cetak classification report menggunakan y_test dan preds_df.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])

# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)

# Print the row counts for each loan status
print(____[____].____())

# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

Edit dan Jalankan Kode