La tabella di strategia e la curva di strategia
Ripetendo i calcoli che hai fatto nell'esercizio precedente per diverse percentuali di accettazione, puoi ottenere una tabella di strategia. Questa tabella è uno strumento utile per le banche, perché offre una visione più chiara per definire una strategia di accettazione.
Ora sai calcolare il bad rate per una certa percentuale di accettazione, quindi la funzione strategy_bank è stata scritta e caricata nel tuo workspace per velocizzare il lavoro. Questa funzione calcola il cut-off e il bad rate per percentuali di accettazione multiple del 5% (0%, 5%, 10%, …).
Questo esercizio fa parte del corso
Credit Risk Modeling in R
Istruzioni dell'esercizio
- Dai un'occhiata alla funzione
strategy_bank. - Il vettore
predictions_cloglogcontiene le probabilità previste di default usando il modello cloglog che hai usato nel capitolo 2; il vettorepredictions_loss_matrixcontiene le probabilità previste di default usando l'albero potato con una loss matrix (costruita in precedenza nel capitolo 3). Applica la funzionestrategy_banka ciascuno dei vettori di previsione e assegna rispettivamente i nomistrategy_cloglogestrategy_loss_matrix. - Puoi ottenere le tabelle di strategia usando i nomi degli oggetti in combinazione con
$table. - Le curve di strategia sono già state tracciate per te. La curva di strategia del modello ad albero mostra un comportamento piuttosto strano. A causa della struttura degli alberi di classificazione, qui potresti avere maggiori probabilità di "salti" anomali. Inoltre, l'albero con la loss matrix era molto grande, quindi questo potrebbe essere il risultato di overfitting!
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Have a look at the function strategy_bank
# Apply the function strategy_bank to both predictions_cloglog and predictions_loss_matrix
# Obtain the strategy tables for both prediction-vectors
# Plot the strategy functions
par(mfrow = c(1,2))
plot(strategy_cloglog$accept_rate, strategy_cloglog$bad_rate,
type = "l", xlab = "Acceptance rate", ylab = "Bad rate",
lwd = 2, main = "logistic regression")
plot(strategy_loss_matrix$accept_rate, strategy_loss_matrix$bad_rate,
type = "l", xlab = "Acceptance rate",
ylab = "Bad rate", lwd = 2, main = "tree")