Report di classificazione dei default

È il momento di esaminare più da vicino la valutazione del modello. Qui l’impostazione della soglia per la probabilità di default ti aiuterà ad analizzare le prestazioni del modello tramite il report di classificazione.

Creare un data frame con le probabilità rende più semplice lavorarci, perché puoi sfruttare tutta la potenza di pandas. Applica la soglia ai dati e controlla il conteggio dei valori per entrambe le classi di loan_status per vedere quante previsioni di ciascun tipo vengono generate. Questo ti aiuterà a interpretare i punteggi del report di classificazione.

L’insieme di dati cr_loan_prep, il modello di regressione logistica addestrato clf_logistic, i valori reali dello stato del prestito y_test e le probabilità previste preds sono già caricati nell’ambiente di lavoro.

Questo esercizio fa parte del corso

Credit Risk Modeling in Python

Visualizza corso

Istruzioni dell'esercizio

Crea un data frame con sole le probabilità di default da preds chiamato preds_df.
Riassegna i valori di loan_status in base a una soglia di 0.50 per la probabilità di default in preds_df.
Stampa il conteggio dei valori del numero di righe per ciascun loan_status.
Stampa il report di classificazione usando y_test e preds_df.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])

# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)

# Print the row counts for each loan status
print(____[____].____())

# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

Modifica ed esegui il codice