Aan de slagBegin gratis

De kleinste clusters beoordelen

In deze oefening ga je kijken naar de clusters die uit DBSCAN zijn gekomen en bepaalde clusters als fraude markeren:

  • je zoekt eerst uit hoe groot de clusters zijn en filtert de kleinste eruit
  • vervolgens neem je de kleinste en markeer je die als fraude
  • tot slot controleer je met de oorspronkelijke labels of dit inderdaad goed werkt om fraude te detecteren.

Beschikbaar zijn de voorspellingen van het DBSCAN-model: n_clusters is beschikbaar en de clusterlabels zijn opgeslagen in pred_labels. Aan de slag!

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)
Code bewerken en uitvoeren