Pemilihan kolom dan kinerja model

Membuat himpunan pelatihan dari kombinasi kolom yang berbeda akan memengaruhi model dan nilai kepentingan kolom. Apakah pemilihan kolom yang berbeda juga memengaruhi skor F-1, gabungan dari precision dan recall, pada model? Anda dapat menjawab pertanyaan ini dengan melatih dua model berbeda pada dua himpunan kolom yang berbeda, lalu memeriksa kinerjanya.

Memprediksi gagal bayar secara keliru sebagai tidak gagal bayar dapat menimbulkan kerugian tak terduga jika probabilitas gagal bayar untuk pinjaman tersebut sangat rendah. Anda dapat menggunakan skor F-1 untuk kelas gagal bayar guna melihat seberapa akurat model memprediksi gagal bayar.

Data kredit, cr_loan_prep, serta dua himpunan kolom pelatihan X dan X2 telah dimuat di workspace. Model gbt dan gbt2 sudah dilatih.

Latihan ini merupakan bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))

Edit dan Jalankan Kode