Aan de slagGa gratis aan de slag

De kans op wanbetaling voorspellen

In de video heb je gekeken naar de voorspelde kans op wanbetaling voor één geval in de testset. Gelukkig kun je de kans voor alle gevallen in de testset in één keer voorspellen met de functie predict().

Als je alle voorspellingen voor de testset hebt, is het handig om een eerste indruk te krijgen van hoe goed het model kan discrimineren door te kijken naar het bereik van de voorspelde kansen. Een klein bereik betekent dat de voorspellingen voor de testset niet ver uit elkaar liggen, en dus dat het model misschien niet zo goed is in het onderscheiden van goede en slechte klanten. Bij lage wanbetalingspercentages zul je merken dat er over het algemeen erg lage kansen op wanbetaling worden voorspeld. Tijd om naar een eerste model te kijken.

log_model_small is ingeladen in de werkruimte.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in R

Cursus bekijken

Oefeninstructies

  • De code voor de voorspelling van test_case uit de video staat al in je werkruimte. Pas de code zo aan dat de functie predict() wordt toegepast op alle gevallen in test_set. Je kunt ze opslaan in het object predictions_all_small.
  • Krijg een eerste indruk van hoe goed het model kan discrimineren met range()

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Make PD-predictions for all the test set elements using the "log_model_small" logistic regression model
predictions_all_small <- predict(log_model_small, newdata = test_case, type = "response")

# Look at the range of the object "predictions_all_small"
Code bewerken en uitvoeren