Aan de slagGa gratis aan de slag

Basis logistieke regressie

In de video bekeek je een logistiek regressiemodel met de variabele age als predictor. Nu voeg je een categorische variabele toe en leer je hoe je de parameterschattingen interpreteert.

Als je in R een categorische variabele opneemt in een logistiek regressiemodel, krijg je een parameterschatting voor alle categorieën behalve één. De categorie waarvoor geen parameterschatting wordt gegeven, heet de cursief referentiecategorie. De parameter voor elk van de andere categorieën staat voor de oddsratio ten gunste van een wanbetaling op de lening tussen de categorie van interesse en de referentiecategorie. Maak je geen zorgen als dit nog niet helemaal duidelijk is; je gaat hier later meer oefeningen over doen!

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in R

Cursus bekijken

Oefeninstructies

  • Bouw een logistiek regressiemodel log_model_cat met de categorische variabele ir_cat als enige predictor. Je aanroep van glm() moet drie argumenten bevatten:
  • loan_status ~ ir_cat
  • family = "binomial"
  • data = training_set
  • Bekijk het resultaat in de console om je parameterschattingen te zien.
  • Zoek uit wat de referentiecategorie is door opnieuw naar de structuur van ir_cat te kijken (in de volledige gegevensset loan_data). Gebruik hiervoor de functie table().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build a glm model with variable ir_cat as a predictor



# Print the parameter estimates 


# Look at the different categories in ir_cat using table()
Code bewerken en uitvoeren