1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

ćwiczenie

Kolejna runda przycinania na podstawie AUC

W materiale wideo zobaczyłeś(-aś), jak „pełny" model regresji logistycznej z funkcją łączącą logit był przycinany na podstawie AUC. Zmienna home_ownership została usunięta z modelu, ponieważ poprawiło to ogólną wartość AUC. Po powtórzeniu tego procesu w dwóch kolejnych rundach usunięto zmienne age oraz ir_cat, co doprowadziło do modelu:

log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)

z AUC równym 0,6545. Teraz twoja kolej – sprawdź, czy AUC można jeszcze poprawić, usuwając kolejną zmienną z modelu.

Instrukcje

100 XP
  • Usuwaj po jednej zmiennej z modelu log_3_remove_ir. Pamiętaj, aby używać domyślnej funkcji łączącej (logit).
  • Wykonaj predykcję prawdopodobieństwa niewykonania zobowiązania dla każdego z utworzonych modeli.
  • Użyj funkcji auc(), podając test_set$loan_status jako pierwszy argument, a predykcje dla każdego z modeli jako drugi argument, aby uzyskać wartości AUC dla każdego modelu.
  • Skopiuj nazwę obiektu (podaną w pierwszym pytaniu tego ćwiczenia), który odpowiada modelowi z najlepszym AUC.