Seuils et matrices de confusion
Vous avez examiné le réglage des seuils pour les défauts, mais quel est l’impact sur les performances globales ? Pour cela, commencez par analyser les effets à l’aide de matrices de confusion.
Rappelez-vous la matrice de confusion illustrée ici :
Définissez différentes valeurs de seuil pour la probabilité de défaut et utilisez une matrice de confusion pour voir comment ces valeurs influent sur les performances du modèle.
Le DataFrame de prédictions, preds_df, ainsi que le modèle clf_logistic ont été chargés dans l’espace de travail.
Cet exercice fait partie du cours
<cours>Modélisation du risque de crédit en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Set the threshold for defaults to 0.5
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the confusion matrix
print(____(____,____[____]))