MulaiMulai sekarang secara gratis

Membandingkan laporan model

Anda telah menggunakan model logistic regression dan gradient boosted trees. Sekarang saatnya membandingkan keduanya untuk menentukan model mana yang akan digunakan guna membuat prediksi akhir.

Salah satu langkah awal termudah untuk membandingkan kemampuan model yang berbeda dalam memprediksi probabilitas default adalah melihat metriknya dari classification_report(). Dengan ini, Anda dapat melihat berbagai metrik penilaian secara berdampingan untuk setiap model. Karena data dan model biasanya tidak seimbang dengan sedikit default, fokuslah terlebih dahulu pada metrik untuk default.

Model terlatih clf_logistic dan clf_gbt telah dimuat ke dalam workspace bersama prediksinya preds_df_lr dan preds_df_gbt. Batas keputusan (cutoff) sebesar 0.4 digunakan untuk masing-masing. Himpunan uji y_test juga tersedia.

Latihan ini adalah bagian dari kursus

Pemodelan Risiko Kredit dengan Python

Lihat Kursus

Petunjuk latihan

  • Cetak classification_report() untuk prediksi logistic regression.
  • Cetak classification_report() untuk prediksi gradient boosted tree.
  • Cetak macro average dari F-1 Score untuk logistic regression menggunakan precision_recall_fscore_support().
  • Cetak macro average dari F-1 Score untuk gradient boosted tree menggunakan precision_recall_fscore_support().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Print the logistic regression classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

# Print the gradient boosted tree classification report
print(____(____, ____['loan_status'], target_names=target_names))

# Print the default F-1 scores for the logistic regression
print(____(____,____['loan_status'], average = 'macro')[2])

# Print the default F-1 scores for the gradient boosted tree
print(____(____,____['loan_status'], average = 'macro')[2])
Edit dan Jalankan Kode