De kans op wanbetaling voorspellen
In de video heb je gekeken naar de voorspelde kans op wanbetaling voor één geval in de testset. Gelukkig kun je de kans voor alle gevallen in de testset in één keer voorspellen met de functie predict().
Als je alle voorspellingen voor de testset hebt, is het handig om een eerste indruk te krijgen van hoe goed het model kan discrimineren door te kijken naar het bereik van de voorspelde kansen. Een klein bereik betekent dat de voorspellingen voor de testset niet ver uit elkaar liggen, en dus dat het model misschien niet zo goed is in het onderscheiden van goede en slechte klanten. Bij lage wanbetalingspercentages zul je merken dat er over het algemeen erg lage kansen op wanbetaling worden voorspeld. Tijd om naar een eerste model te kijken.
log_model_small is ingeladen in de werkruimte.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in R
Oefeninstructies
- De code voor de voorspelling van
test_caseuit de video staat al in je werkruimte. Pas de code zo aan dat de functiepredict()wordt toegepast op alle gevallen intest_set. Je kunt ze opslaan in het objectpredictions_all_small. - Krijg een eerste indruk van hoe goed het model kan discrimineren met
range()
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Make PD-predictions for all the test set elements using the "log_model_small" logistic regression model
predictions_all_small <- predict(log_model_small, newdata = test_case, type = "response")
# Look at the range of the object "predictions_all_small"