Meer onderscheidende modellen maken
In de vorige oefening was het bereik van de voorspelde wanbetalingskansen vrij klein. Zoals besproken zijn kleine voorspelde wanbetalingskansen te verwachten bij lage defaultpercentages, maar grotere modellen bouwen (wat in feite betekent: meer predictoren opnemen) kan het bereik van je voorspellingen vergroten.
Of dit uiteindelijk tot betere voorspellingen leidt, moet nog worden gevalideerd en hangt af van de kwaliteit van de nieuw opgenomen predictoren. Kijk eerst hoe grotere modellen het bereik kunnen vergroten.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in R
Oefeninstructies
- Maak
log_model_fullop dezelfde manier alslog_model_small, maar neem dit keer alle beschikbare predictoren in de gegevensset op. Als je niet elke kolomnaam apart wilt typen, kun je eenvoudig alle variabelen selecteren metloan_status ~ . - Maak je voorspellingsvector
predictions_all_fullvoor alle gevallen in de testset metpredict(). Merk op dat deze waarden de kans op wanbetaling voorstellen. - Bekijk het bereik van de voorspellingen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)
# Make PD-predictions for all test set elements using the the full logistic regression model
# Look at the predictions range