Report di classificazione dei default
È il momento di esaminare più da vicino la valutazione del modello. Qui l’impostazione della soglia per la probabilità di default ti aiuterà ad analizzare le prestazioni del modello tramite il report di classificazione.
Creare un data frame con le probabilità rende più semplice lavorarci, perché puoi sfruttare tutta la potenza di pandas. Applica la soglia ai dati e controlla il conteggio dei valori per entrambe le classi di loan_status per vedere quante previsioni di ciascun tipo vengono generate. Questo ti aiuterà a interpretare i punteggi del report di classificazione.
L’insieme di dati cr_loan_prep, il modello di regressione logistica addestrato clf_logistic, i valori reali dello stato del prestito y_test e le probabilità previste preds sono già caricati nell’ambiente di lavoro.
Questo esercizio fa parte del corso
Credit Risk Modeling in Python
Istruzioni dell'esercizio
- Crea un data frame con sole le probabilità di default da
predschiamatopreds_df. - Riassegna i valori di
loan_statusin base a una soglia di0.50per la probabilità di default inpreds_df. - Stampa il conteggio dei valori del numero di righe per ciascun
loan_status. - Stampa il report di classificazione usando
y_testepreds_df.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))