Aan de slagBegin gratis

Een cut-off instellen

We hebben je laten zien hoe het kiezen van een cut-off het verschil kan maken om een goede confusion matrix te krijgen. Nu leer je hoe je de voorspellingenvector omzet naar een vector met binaire waarden die de status van de lening aangeven. De functie ifelse() in R helpt je daarbij.

Als je ifelse() gebruikt in de context van een cut-off, krijg je iets als:

ifelse(predictions > 0.3, 1, 0)

In het eerste argument test je of een bepaalde waarde in de voorspellingenvector groter is dan 0.3. Als dit TRUE is, geeft R "1" terug (gespecificeerd in het tweede argument), als dit FALSE is, geeft R "0" terug (gespecificeerd in het derde argument), wat respectievelijk "default" en "geen default" voorstelt.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in R

Bekijk cursus

Oefeninstructies

  • De code voor het volledige logistic regression-model samen met de voorspellingenvector staat in je console.
  • Gebruik een cut-off van 0.15 en maak de vector pred_cutoff_15 met de functie ifelse() en predictions_all_full.
  • Bekijk de confusion matrix met table() (voer de echte waarden, dus test_set$loan_status, in als eerste argument).

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# The code for the logistic regression model and the predictions is given below
log_model_full <- glm(loan_status ~ ., family = "binomial", data = training_set)
predictions_all_full <- predict(log_model_full, newdata = test_set, type = "response")

# Make a binary predictions-vector using a cut-off of 15%


# Construct a confusion matrix
Code bewerken en uitvoeren