CommencerCommencer gratuitement

Évaluer les plus petits clusters

Dans cet exercice, vous allez examiner les clusters produits par DBSCAN et marquer certains clusters comme frauduleux :

  • vous devez d’abord déterminer la taille des clusters et filtrer les plus petits
  • ensuite, vous prendrez les plus petits et les signalerez comme fraude
  • enfin, vous vérifierez avec les étiquettes d’origine si cette approche détecte correctement la fraude.

Les prédictions du modèle DBSCAN sont disponibles : n_clusters ainsi que les étiquettes de cluster enregistrées dans pred_labels. Essayons !

Cet exercice fait partie du cours

Détection de fraude en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)
Modifier et exécuter le code