Rapport de classification des défauts

Il est temps d’examiner de plus près l’évaluation du modèle. C’est ici que le choix du seuil pour la probabilité de défaut vous aide à analyser les performances du modèle via un rapport de classification.

Créer un data frame des probabilités facilite la manipulation, car vous pouvez tirer parti de toute la puissance de pandas. Appliquez le seuil aux données et vérifiez le décompte des valeurs pour les deux classes de loan_status afin de voir combien de prédictions de chaque type sont produites. Cela vous aidera à interpréter les scores du rapport de classification.

Le jeu de données cr_loan_prep, la régression logistique entraînée clf_logistic, les valeurs réelles de statut de prêt y_test et les probabilités prédites preds sont chargés dans l’espace de travail.

Cet exercice fait partie du cours

Modélisation du risque de crédit en Python

Afficher le cours

Instructions

Créez un data frame ne contenant que les probabilités de défaut issues de preds, nommé preds_df.
Réassignez les valeurs de loan_status selon un seuil de 0.50 pour la probabilité de défaut dans preds_df.
Affichez le décompte des valeurs du nombre de lignes pour chaque loan_status.
Affichez le rapport de classification en utilisant y_test et preds_df.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])

# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)

# Print the row counts for each loan status
print(____[____].____())

# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

Modifier et exécuter le code