Pemilihan kolom dan kinerja model
Membuat himpunan pelatihan dari kombinasi kolom yang berbeda akan memengaruhi model dan nilai kepentingan kolom. Apakah pemilihan kolom yang berbeda juga memengaruhi skor F-1, gabungan dari precision dan recall, pada model? Anda dapat menjawab pertanyaan ini dengan melatih dua model berbeda pada dua himpunan kolom yang berbeda, lalu memeriksa kinerjanya.
Memprediksi gagal bayar secara keliru sebagai tidak gagal bayar dapat menimbulkan kerugian tak terduga jika probabilitas gagal bayar untuk pinjaman tersebut sangat rendah. Anda dapat menggunakan skor F-1 untuk kelas gagal bayar guna melihat seberapa akurat model memprediksi gagal bayar.
Data kredit, cr_loan_prep, serta dua himpunan kolom pelatihan X dan X2 telah dimuat di workspace. Model gbt dan gbt2 sudah dilatih.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)
# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))
# Print the classification report of the second model
print(____(____, ____, target_names=target_names))