Modelresultaten controleren
In de vorige oefening heb je alle observaties als fraude gemarkeerd als ze in de bovenste 5e percentiel qua afstand tot het clustercentrum vallen. Dit zijn dus de echte uitschieters van de drie clusters. Voor deze oefening zijn de geschaalde data en labels al opgesplitst in train- en testset, dus y_test is beschikbaar. De voorspellingen uit de vorige oefening, km_y_pred, zijn ook beschikbaar. Laten we wat prestatiematen maken en kijken hoe goed je het hebt gedaan.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Obtain the ROC score
print(____(____, ____))