AUC'ye göre bir başka budama turu
Videoda, logit bağlantı işlevine sahip "tam" lojistik regresyon modelinin AUC'ye göre nasıl budandığını gördün. Toplam AUC'yi iyileştirdiği için home_ownership değişkeninin modelden çıkarıldığını izledin. Bu işlemi iki tur daha tekrarladıktan sonra age ve ir_cat değişkenleri de çıkarıldı ve şu model elde edildi:
log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)
AUC değeri 0.6545. Şimdi sırada sende: Modelden bir değişken daha çıkararak AUC'nin hâlâ iyileşip iyileşmeyeceğini test et.
Bu egzersiz
R ile Kredi Riski Modellemesi
kursunun bir parçasıdırEgzersiz talimatları
log_3_remove_irmodelinde her seferinde bir değişkeni sil. Varsayılan bağlantı fonksiyonunu (logit) kullandığını unutma.- Oluşturduğun her model için temerrüt olasılığı tahminleri üret.
- Her model için AUC hesaplamak üzere
auc()fonksiyonunu kullan: ilk argümantest_set$loan_status, ikinci argüman ise dört modelin her biri için elde ettiğin tahminler olmalı. - En iyi AUC'ye sahip modeli temsil eden nesnenin adını (bu egzersizin ilk sorusunda verildiği şekilde) kopyala.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build four models each time deleting one variable in log_3_remove_ir
log_4_remove_amnt <- glm(loan_status ~ grade + annual_inc + emp_cat,
family = binomial, data = training_set)
log_4_remove_grade <-
log_4_remove_inc <-
log_4_remove_emp <-
# Make PD-predictions for each of the models
pred_4_remove_amnt <- predict(log_4_remove_amnt, newdata = test_set, type = "response")
pred_4_remove_grade <-
pred_4_remove_inc <-
pred_4_remove_emp <-
# Compute the AUCs