K-Means-Clustering

Ein sehr häufig verwendeter Clustering-Algorithmus ist das K-Means-Clustering. Für die Betrugserkennung ist K-Means leicht umzusetzen und relativ leistungsfähig, um verdächtige Fälle vorherzusagen. Es ist ein guter Algorithmus, um bei Fraud-Detection-Problemen einzusteigen. Betrugsdaten sind jedoch oft sehr groß, besonders wenn du mit Transaktionsdaten arbeitest. MiniBatch K-Means ist eine effiziente Möglichkeit, K-Means auf einem großen Datensatz anzuwenden — und genau das nutzt du in dieser Übung.

Die skalierten Daten aus der vorherigen Übung, X_scaled, stehen bereit. Probier es aus.

Diese Übung ist Teil des Kurses

<Kurs>Betrugserkennung mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Importiere MiniBatchKMeans aus sklearn.
Initialisiere das Minibatch-K-Means-Modell mit 8 Clustern.
Trainiere das Modell auf deinen skalierten Daten.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)

Code bearbeiten und ausführen