1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

cvičení

Lze model dále zjednodušit?

Odebráním proměnné loan_amnt lze AUC dále zlepšit na 0,6548! Výsledný model vypadá takto:

log_4_remove_amnt <- glm(loan_status ~ grade + annual_inc + emp_cat, family = binomial, data = training_set) 

Je možné zredukovat logistický regresní model na pouhé dvě proměnné, aniž by se AUC snížilo? V tomto cvičení to zjistíš!

Pokyny

100 XP
  • Opět odebírej vždy jednu proměnnou z modelu log_4_remove_amnt. Nezapomeň použít výchozí linkovou funkci (logit).
  • Pomocí predict() vypočítej pravděpodobnost selhání pro každý vytvořený model.
  • Zjisti hodnoty AUC pro každý ze tří modelů – jako první argument použij test_set$loan_status a jako druhý predikce příslušného modelu.
  • Vykresli ROC křivku pro model s nejvyšším AUC pomocí plot(roc()), kde obsah roc() je stejný jako obsah funkce auc() s nejvyšším AUC. Může se stát, že AUC již nelze oproti modelu log_4_remove_amnt dále zlepšit. Pro tento případ jsou predikce tohoto modelu načteny v pracovním prostředí jako pred_4_remove_amnt.