Aan de slagGa gratis aan de slag

Meer onderscheidende modellen maken

In de vorige oefening was het bereik van de voorspelde wanbetalingskansen vrij klein. Zoals besproken zijn kleine voorspelde wanbetalingskansen te verwachten bij lage defaultpercentages, maar grotere modellen bouwen (wat in feite betekent: meer predictoren opnemen) kan het bereik van je voorspellingen vergroten.

Of dit uiteindelijk tot betere voorspellingen leidt, moet nog worden gevalideerd en hangt af van de kwaliteit van de nieuw opgenomen predictoren. Kijk eerst hoe grotere modellen het bereik kunnen vergroten.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in R

Cursus bekijken

Oefeninstructies

  • Maak log_model_full op dezelfde manier als log_model_small, maar neem dit keer alle beschikbare predictoren in de gegevensset op. Als je niet elke kolomnaam apart wilt typen, kun je eenvoudig alle variabelen selecteren met loan_status ~ .
  • Maak je voorspellingsvector predictions_all_full voor alle gevallen in de testset met predict(). Merk op dat deze waarden de kans op wanbetaling voorstellen.
  • Bekijk het bereik van de voorspellingen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)

# Make PD-predictions for all test set elements using the the full logistic regression model


# Look at the predictions range

Code bewerken en uitvoeren