1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Modelování kreditního rizika v R

Connected

cvičení

Tvorba diskriminativnějších modelů

V předchozím cvičení byl rozsah predikovaných pravděpodobností defaultu poměrně malý. Jak jsme si řekli, nízké predikované pravděpodobnosti defaultu jsou při nízkých mírách defaultu očekávatelné – ale větší modely (tedy modely s více prediktory) dokážou tento rozsah rozšířit.

Zda to nakonec povede k lepším predikcím, je třeba ověřit a záleží na kvalitě nově přidaných prediktorů. Nejdřív se ale podívejme, jak větší modely dokážou rozsah predikcí rozšířit.

Pokyny

100 XP
  • Vytvoř log_model_full stejným způsobem jako log_model_small, tentokrát ale zahrň všechny dostupné prediktory v datové sadě. Pokud nechceš vypisovat názvy všech sloupců zvlášť, můžeš jednoduše vybrat všechny proměnné pomocí loan_status ~ .
  • Vytvoř vektor predikcí predictions_all_full pro všechny záznamy v testovací sadě pomocí funkce predict(). Všimni si, že tyto hodnoty představují pravděpodobnost defaultu.
  • Podívej se na rozsah predikcí.