Bewertung der kleinsten Cluster

In dieser Übung schaust du dir die Cluster an, die aus DBSCAN herausgekommen sind, und markierst bestimmte Cluster als Betrug:

zuerst findest du heraus, wie groß die Cluster sind, und filterst die kleinsten heraus
dann nimmst du die kleinsten und markierst sie als Betrug
zum Schluss prüfst du mit den ursprünglichen Labels, ob das tatsächlich gut funktioniert, um Betrug zu erkennen.

Vorhanden sind die Vorhersagen des DBSCAN-Modells: n_clusters sowie die Cluster-Labels unter pred_labels. Probieren wir’s aus!

Diese Übung ist Teil des Kurses

<Kurs>Betrugserkennung mit Python</Kurs>

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)