Vérifier les résultats du modèle
Dans l’exercice précédent, vous avez signalé toutes les observations comme frauduleuses si elles se situaient dans le 95e centile supérieur de distance par rapport au centroïde du cluster. Autrement dit, ce sont les valeurs très atypiques des trois clusters. Pour cet exercice, vous disposez déjà des données mises à l’échelle et des étiquettes séparées en ensembles d’entraînement et de test, donc y_test est disponible. Les prédictions de l’exercice précédent, km_y_pred, sont également disponibles. Créons quelques métriques de performance pour évaluer vos résultats.
Cet exercice fait partie du cours
Détection de fraude en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Obtain the ROC score
print(____(____, ____))