Bewertung der kleinsten Cluster
In dieser Übung schaust du dir die Cluster an, die aus DBSCAN herausgekommen sind, und markierst bestimmte Cluster als Betrug:
- zuerst findest du heraus, wie groß die Cluster sind, und filterst die kleinsten heraus
- dann nimmst du die kleinsten und markierst sie als Betrug
- zum Schluss prüfst du mit den ursprünglichen Labels, ob das tatsächlich gut funktioniert, um Betrug zu erkennen.
Vorhanden sind die Vorhersagen des DBSCAN-Modells: n_clusters sowie die Cluster-Labels unter pred_labels. Probieren wir’s aus!
Diese Übung ist Teil des Kurses
Betrugserkennung mit Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])
# Print the result
print(counts)