1. Learn
  2. /
  3. Kurser
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

övning

Czy model można jeszcze uprościć?

Po usunięciu zmiennej loan_amnt wartość AUC wzrasta do 0,6548! Otrzymany model ma postać:

log_4_remove_amnt <- glm(loan_status ~ grade + annual_inc + emp_cat, family = binomial, data = training_set) 

Czy można zredukować model regresji logistycznej do zaledwie dwóch zmiennych bez obniżenia wartości AUC? W tym ćwiczeniu sprawdzisz, czy jest to możliwe!

Instruktioner

100 XP
  • Ponownie usuń po jednej zmiennej z modelu log_4_remove_amnt. Pamiętaj, że powinna być użyta domyślna funkcja łącząca (logit).
  • Użyj funkcji predict(), aby wyznaczyć prawdopodobieństwa niewywiązania się ze zobowiązania dla każdego z utworzonych modeli.
  • Oblicz wartości AUC dla każdego z trzech modeli, podając test_set$loan_status jako pierwszy argument i przewidywania każdego modelu jako drugi argument.
  • Narysuj krzywą ROC dla modelu o najwyższej wartości AUC, używając plot(roc()), gdzie zawartość roc() jest taka sama jak zawartość funkcji auc() z najwyższym AUC. Zwróć uwagę, że możliwe jest, iż AUC nie da się już poprawić względem modelu log_4_remove_amnt. W takim przypadku przewidywania dla tego modelu są wczytane do twojego środowiska pod nazwą pred_4_remove_amnt.