1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

cvičení

Další kolo prořezávání na základě AUC

Ve videu jsi viděl/a, jak byl „plný" model logistické regrese s logit linkem prořezáván na základě AUC. Z modelu byla odstraněna proměnná home_ownership, protože to celkové AUC zlepšilo. Po dalších dvou kolech tohoto procesu byly odstraněny proměnné age a ir_cat, čímž vznikl model:

log_3_remove_ir <- glm(loan_status ~ loan_amnt + grade + annual_inc + emp_cat, family = binomial, data = training_set)

s hodnotou AUC 0,6545. Teď je řada na tobě – zkus zjistit, zda lze AUC ještě zlepšit odebráním další proměnné z modelu.

Pokyny

100 XP
  • V modelu log_3_remove_ir odebírej vždy jednu proměnnou – nezapomeň použít výchozí link funkci (logit).
  • Pro každý z vytvořených modelů spočítej pravděpodobnost selhání splácení.
  • Pomocí funkce auc() zadej jako první argument test_set$loan_status a jako druhý argument predikce pro každý model, abys získal/a hodnoty AUC pro jednotlivé modely.
  • Zkopíruj název objektu (uvedeného v první otázce tohoto cvičení), který odpovídá modelu s nejlepším AUC.