Model raporlarını karşılaştırma
Lojistik regresyon modelleri ve gradient boosted trees kullandın. Şimdi bu ikisini karşılaştırıp son tahminler için hangi modeli kullanacağına karar verme zamanı.
Farklı modellerin temerrüt olasılığını tahmin etme becerisini karşılaştırmanın en kolay ilk adımlarından biri, classification_report() çıktılarındaki metriklerine bakmaktır. Bununla birlikte, her model için pek çok farklı skorlama metriğini yan yana görebilirsin. Veri ve modeller genellikle az sayıda temerrütle dengesiz olduğundan, şimdilik temerrüt sınıfına ait metriklere odaklan.
Eğitilmiş modeller clf_logistic ve clf_gbt, ayrıca onların tahminleri preds_df_lr ve preds_df_gbt çalışma alanına yüklendi. Her biri için 0.4 eşik değeri kullanıldı. Test kümesi y_test de mevcut.
Bu egzersiz
Python ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
- Lojistik regresyon tahminleri için
classification_report()çıktısını yazdır. - Gradient boosted tree tahminleri için
classification_report()çıktısını yazdır. - Lojistik regresyon için
precision_recall_fscore_support()kullanarak F-1 Skoru'nunmacro averagedeğerini yazdır. - Gradient boosted tree için
precision_recall_fscore_support()kullanarak F-1 Skoru'nunmacro averagedeğerini yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print the logistic regression classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))
# Print the gradient boosted tree classification report
print(____(____, ____['loan_status'], target_names=target_names))
# Print the default F-1 scores for the logistic regression
print(____(____,____['loan_status'], average = 'macro')[2])
# Print the default F-1 scores for the gradient boosted tree
print(____(____,____['loan_status'], average = 'macro')[2])