CommencerCommencez gratuitement

Évaluer les plus petits clusters

Dans cet exercice, vous allez examiner les clusters produits par DBSCAN et marquer certains clusters comme frauduleux :

  • vous devez d’abord déterminer la taille des clusters et filtrer les plus petits
  • ensuite, vous prendrez les plus petits et les signalerez comme fraude
  • enfin, vous vérifierez avec les étiquettes d’origine si cette approche détecte correctement la fraude.

Les prédictions du modèle DBSCAN sont disponibles : n_clusters ainsi que les étiquettes de cluster enregistrées dans pred_labels. Essayons !

Cet exercice fait partie du cours

<cours>Détection de fraude en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)
Modifier et exécuter le code