Évaluer les plus petits clusters
Dans cet exercice, vous allez examiner les clusters produits par DBSCAN et marquer certains clusters comme frauduleux :
- vous devez d’abord déterminer la taille des clusters et filtrer les plus petits
- ensuite, vous prendrez les plus petits et les signalerez comme fraude
- enfin, vous vérifierez avec les étiquettes d’origine si cette approche détecte correctement la fraude.
Les prédictions du modèle DBSCAN sont disponibles : n_clusters ainsi que les étiquettes de cluster enregistrées dans pred_labels. Essayons !
Cet exercice fait partie du cours
Détection de fraude en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])
# Print the result
print(counts)