De kleinste clusters beoordelen
In deze oefening ga je kijken naar de clusters die uit DBSCAN zijn gekomen en bepaalde clusters als fraude markeren:
- je zoekt eerst uit hoe groot de clusters zijn en filtert de kleinste eruit
- vervolgens neem je de kleinste en markeer je die als fraude
- tot slot controleer je met de oorspronkelijke labels of dit inderdaad goed werkt om fraude te detecteren.
Beschikbaar zijn de voorspellingen van het DBSCAN-model: n_clusters is beschikbaar en de clusterlabels zijn opgeslagen in pred_labels. Aan de slag!
Deze oefening maakt deel uit van de cursus
Fraudedetectie in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])
# Print the result
print(counts)