1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

cvičení

Porovnání linkových funkcí pro danou prahovou hodnotu

V tomto závěrečném cvičení natrénuješ model pro každou ze tří linkových funkcí (logit, probit a cloglog), vytvoříš predikce pro testovací sadu, klasifikuješ je do příslušné skupiny (defaultní vs. nedefaultní) podle zvolené prahové hodnoty, sestavíš matici záměn a vypočítáš přesnost a senzitivitu každého modelu. Nakonec zkusíš určit, který model si vede nejlépe z hlediska přesnosti při dané prahové hodnotě!

Měj na paměti, že rozdíly mezi modely bývají zpravidla velmi malé a výsledky závisí na zvolené prahové hodnotě. Skutečný výsledek (defaultní vs. nedefaultní) je uložen v proměnné true_val v konzoli.

Pokyny

100 XP
  • Natrénuj tři modely logistické regrese s linkovými funkcemi logit, probit a cloglog. Část kódu je již připravená. Jako prediktory použij age, emp_cat, ir_cat a loan_amnt.
  • Vytvoř predikce pro všechny tři modely pomocí test_set.
  • Použij prahovou hodnotu 14 % pro klasifikaci predikcí každého modelu, aby bylo možné vyhodnotit jejich výkon.
  • Sestavte matici záměn pro všechny tři modely.
  • Nakonec vypočítej klasifikační přesnost pro každý z modelů.