Aan de slagGa gratis aan de slag

De kleinste clusters beoordelen

In deze oefening ga je kijken naar de clusters die uit DBSCAN zijn gekomen en bepaalde clusters als fraude markeren:

  • je zoekt eerst uit hoe groot de clusters zijn en filtert de kleinste eruit
  • vervolgens neem je de kleinste en markeer je die als fraude
  • tot slot controleer je met de oorspronkelijke labels of dit inderdaad goed werkt om fraude te detecteren.

Beschikbaar zijn de voorspellingen van het DBSCAN-model: n_clusters is beschikbaar en de clusterlabels zijn opgeslagen in pred_labels. Aan de slag!

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)
Code bewerken en uitvoeren