Valutare i cluster più piccoli

In questo esercizio darai un'occhiata ai cluster ottenuti con DBSCAN e contrassegnerai alcuni cluster come frode:

per prima cosa devi capire quanto sono grandi i cluster e filtrare i più piccoli
poi prenderai quelli più piccoli e li contrassegnerai come frode
infine, controllerai con le etichette originali se questo metodo funziona bene nel rilevare le frodi.

Hai a disposizione le previsioni del modello DBSCAN: n_clusters è disponibile così come le etichette di cluster, salvate in pred_labels. Proviamoci!

Questo esercizio fa parte del corso

Rilevamento delle frodi in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)

Modifica ed esegui il codice