Come le soglie influenzano le prestazioni
Impostare la soglia a 0.4 mostra risultati promettenti per la valutazione del modello. Ora puoi valutare l’impatto finanziario usando il recall dei default, selezionato dal report di classificazione tramite la funzione precision_recall_fscore_support().
Per farlo, stimerai l’ammontare della perdita inattesa usando il recall dei default per trovare quale proporzione di default non hai intercettato con la nuova soglia. Otterrai un importo in dollari che indica a quanto ammonterebbero le perdite se tutti i default non individuati andassero in default simultaneamente.
Il valore medio del prestito, avg_loan_amnt, è stato calcolato ed è disponibile nell’ambiente di lavoro insieme a preds_df e y_test.
Questo esercizio fa parte del corso
Credit Risk Modeling in Python
Istruzioni dell'esercizio
- Riassegna i valori di
loan_statususando la soglia0.4. - Memorizza il numero di default in
preds_dfselezionando il secondo valore dai value counts e salvalo comenum_defaults. - Ottieni il tasso di recall dei default dalla matrice di classificazione e salvalo come
default_recall. - Stima la perdita inattesa dal nuovo recall dei default moltiplicando
1 - default_recallper l’importo medio del prestito e per il numero di prestiti in default.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)
# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]
# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]
# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))