Basis logistieke regressie
In de video bekeek je een logistiek regressiemodel met de variabele age als predictor. Nu voeg je een categorische variabele toe en leer je hoe je de parameterschattingen interpreteert.
Als je in R een categorische variabele opneemt in een logistiek regressiemodel, krijg je een parameterschatting voor alle categorieën behalve één. De categorie waarvoor geen parameterschatting wordt gegeven, heet de cursief referentiecategorie. De parameter voor elk van de andere categorieën staat voor de oddsratio ten gunste van een wanbetaling op de lening tussen de categorie van interesse en de referentiecategorie. Maak je geen zorgen als dit nog niet helemaal duidelijk is; je gaat hier later meer oefeningen over doen!
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in R
Oefeninstructies
- Bouw een logistiek regressiemodel
log_model_catmet de categorische variabeleir_catals enige predictor. Je aanroep van glm() moet drie argumenten bevatten: loan_status ~ ir_catfamily = "binomial"data = training_set- Bekijk het resultaat in de console om je parameterschattingen te zien.
- Zoek uit wat de referentiecategorie is door opnieuw naar de structuur van
ir_catte kijken (in de volledige gegevenssetloan_data). Gebruik hiervoor de functietable().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Build a glm model with variable ir_cat as a predictor
# Print the parameter estimates
# Look at the different categories in ir_cat using table()