Membandingkan laporan model
Anda telah menggunakan model logistic regression dan gradient boosted trees. Sekarang saatnya membandingkan keduanya untuk menentukan model mana yang akan digunakan guna membuat prediksi akhir.
Salah satu langkah awal termudah untuk membandingkan kemampuan model yang berbeda dalam memprediksi probabilitas default adalah melihat metriknya dari classification_report(). Dengan ini, Anda dapat melihat berbagai metrik penilaian secara berdampingan untuk setiap model. Karena data dan model biasanya tidak seimbang dengan sedikit default, fokuslah terlebih dahulu pada metrik untuk default.
Model terlatih clf_logistic dan clf_gbt telah dimuat ke dalam workspace bersama prediksinya preds_df_lr dan preds_df_gbt. Batas keputusan (cutoff) sebesar 0.4 digunakan untuk masing-masing. Himpunan uji y_test juga tersedia.
Latihan ini adalah bagian dari kursus
Pemodelan Risiko Kredit dengan Python
Petunjuk latihan
- Cetak
classification_report()untuk prediksi logistic regression. - Cetak
classification_report()untuk prediksi gradient boosted tree. - Cetak
macro averagedari F-1 Score untuk logistic regression menggunakanprecision_recall_fscore_support(). - Cetak
macro averagedari F-1 Score untuk gradient boosted tree menggunakanprecision_recall_fscore_support().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print the logistic regression classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))
# Print the gradient boosted tree classification report
print(____(____, ____['loan_status'], target_names=target_names))
# Print the default F-1 scores for the logistic regression
print(____(____,____['loan_status'], average = 'macro')[2])
# Print the default F-1 scores for the gradient boosted tree
print(____(____,____['loan_status'], average = 'macro')[2])