Seuils et matrices de confusion
Vous avez examiné le réglage des seuils pour les défauts, mais quel est l’impact sur les performances globales ? Pour cela, commencez par analyser les effets à l’aide de matrices de confusion.
Rappelez-vous la matrice de confusion illustrée ici :
Définissez différentes valeurs de seuil pour la probabilité de défaut et utilisez une matrice de confusion pour voir comment ces valeurs influent sur les performances du modèle.
Le DataFrame de prédictions, preds_df, ainsi que le modèle clf_logistic ont été chargés dans l’espace de travail.
Cet exercice fait partie du cours
Modélisation du risque de crédit en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set the threshold for defaults to 0.5
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the confusion matrix
print(____(____,____[____]))