Valutare i cluster più piccoli
In questo esercizio darai un'occhiata ai cluster ottenuti con DBSCAN e contrassegnerai alcuni cluster come frode:
- per prima cosa devi capire quanto sono grandi i cluster e filtrare i più piccoli
- poi prenderai quelli più piccoli e li contrassegnerai come frode
- infine, controllerai con le etichette originali se questo metodo funziona bene nel rilevare le frodi.
Hai a disposizione le previsioni del modello DBSCAN: n_clusters è disponibile così come le etichette di cluster, salvate in pred_labels. Proviamoci!
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])
# Print the result
print(counts)