K-Means-Clustering
Ein sehr häufig verwendeter Clustering-Algorithmus ist das K-Means-Clustering. Für die Betrugserkennung ist K-Means leicht umzusetzen und relativ leistungsfähig, um verdächtige Fälle vorherzusagen. Es ist ein guter Algorithmus, um bei Fraud-Detection-Problemen einzusteigen. Betrugsdaten sind jedoch oft sehr groß, besonders wenn du mit Transaktionsdaten arbeitest. MiniBatch K-Means ist eine effiziente Möglichkeit, K-Means auf einem großen Datensatz anzuwenden — und genau das nutzt du in dieser Übung.
Die skalierten Daten aus der vorherigen Übung, X_scaled, stehen bereit. Probier es aus.
Diese Übung ist Teil des Kurses
Betrugserkennung mit Python
Anleitung zur Übung
- Importiere
MiniBatchKMeansaussklearn. - Initialisiere das Minibatch-K-Means-Modell mit 8 Clustern.
- Trainiere das Modell auf deinen skalierten Daten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import MiniBatchKmeans
from sklearn.cluster import ____
# Define the model
kmeans = ____(n_clusters=____, random_state=0)
# Fit the model to the scaled data
kmeans.____(____)