De kleinste clusters beoordelen

In deze oefening ga je kijken naar de clusters die uit DBSCAN zijn gekomen en bepaalde clusters als fraude markeren:

je zoekt eerst uit hoe groot de clusters zijn en filtert de kleinste eruit
vervolgens neem je de kleinste en markeer je die als fraude
tot slot controleer je met de oorspronkelijke labels of dit inderdaad goed werkt om fraude te detecteren.

Beschikbaar zijn de voorspellingen van het DBSCAN-model: n_clusters is beschikbaar en de clusterlabels zijn opgeslagen in pred_labels. Aan de slag!

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)

Code bewerken en uitvoeren