Bewertung der kleinsten Cluster
In dieser Übung schaust du dir die Cluster an, die aus DBSCAN herausgekommen sind, und markierst bestimmte Cluster als Betrug:
- zuerst findest du heraus, wie groß die Cluster sind, und filterst die kleinsten heraus
- dann nimmst du die kleinsten und markierst sie als Betrug
- zum Schluss prüfst du mit den ursprünglichen Labels, ob das tatsächlich gut funktioniert, um Betrug zu erkennen.
Vorhanden sind die Vorhersagen des DBSCAN-Modells: n_clusters sowie die Cluster-Labels unter pred_labels. Probieren wir’s aus!
Diese Übung ist Teil des Kurses
<Kurs>Betrugserkennung mit Python</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])
# Print the result
print(counts)