Rapport de classification des défauts
Il est temps d’examiner de plus près l’évaluation du modèle. C’est ici que le choix du seuil pour la probabilité de défaut vous aide à analyser les performances du modèle via un rapport de classification.
Créer un data frame des probabilités facilite la manipulation, car vous pouvez tirer parti de toute la puissance de pandas. Appliquez le seuil aux données et vérifiez le décompte des valeurs pour les deux classes de loan_status afin de voir combien de prédictions de chaque type sont produites. Cela vous aidera à interpréter les scores du rapport de classification.
Le jeu de données cr_loan_prep, la régression logistique entraînée clf_logistic, les valeurs réelles de statut de prêt y_test et les probabilités prédites preds sont chargés dans l’espace de travail.
Cet exercice fait partie du cours
Modélisation du risque de crédit en Python
Instructions
- Créez un data frame ne contenant que les probabilités de défaut issues de
preds, nommépreds_df. - Réassignez les valeurs de
loan_statusselon un seuil de0.50pour la probabilité de défaut danspreds_df. - Affichez le décompte des valeurs du nombre de lignes pour chaque
loan_status. - Affichez le rapport de classification en utilisant
y_testetpreds_df.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))