Specificare un cut-off
Ti abbiamo mostrato come la scelta di un cut-off possa fare la differenza per ottenere una buona matrice di confusione. Ora vedrai come trasformare il vettore di predizioni in un vettore di valori binari che indicano lo stato del prestito. La funzione ifelse() in R può aiutarti.
Applicando la funzione ifelse() nel contesto di un cut-off, avresti qualcosa del tipo
ifelse(predictions > 0.3, 1, 0)
Nel primo argomento, verifichi se un certo valore nel vettore delle predizioni è maggiore di 0.3. Se è TRUE, R restituisce "1" (specificato nel secondo argomento), se è FALSE, R restituisce "0" (specificato nel terzo argomento), che rappresentano rispettivamente "default" e "nessun default".
Questo esercizio fa parte del corso
Credit Risk Modeling in R
Istruzioni dell'esercizio
- Nella console trovi il codice per il modello di regressione logistica completo insieme al vettore di predizioni.
- Usando un cutoff di 0.15, crea il vettore
pred_cutoff_15utilizzando la funzioneifelse()epredictions_all_full. - Osserva la matrice di confusione usando
table()(inserisci i valori veri, cioètest_set$loan_status, come primo argomento).
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# The code for the logistic regression model and the predictions is given below
log_model_full <- glm(loan_status ~ ., family = "binomial", data = training_set)
predictions_all_full <- predict(log_model_full, newdata = test_set, type = "response")
# Make a binary predictions-vector using a cut-off of 15%
# Construct a confusion matrix