Tvorba diskriminativnějších modelů

V předchozím cvičení byl rozsah predikovaných pravděpodobností defaultu poměrně malý. Jak jsme si řekli, nízké predikované pravděpodobnosti defaultu jsou při nízkých mírách defaultu očekávatelné – ale větší modely (tedy modely s více prediktory) dokážou tento rozsah rozšířit.

Zda to nakonec povede k lepším predikcím, je třeba ověřit a záleží na kvalitě nově přidaných prediktorů. Nejdřív se ale podívejme, jak větší modely dokážou rozsah predikcí rozšířit.

Vytvoř log_model_full stejným způsobem jako log_model_small, tentokrát ale zahrň všechny dostupné prediktory v datové sadě. Pokud nechceš vypisovat názvy všech sloupců zvlášť, můžeš jednoduše vybrat všechny proměnné pomocí loan_status ~ .
Vytvoř vektor predikcí predictions_all_full pro všechny záznamy v testovací sadě pomocí funkce predict(). Všimni si, že tyto hodnoty představují pravděpodobnost defaultu.
Podívej se na rozsah predikcí.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení