LoslegenKostenlos loslegen

K-Means-Clustering

Ein sehr häufig verwendeter Clustering-Algorithmus ist das K-Means-Clustering. Für die Betrugserkennung ist K-Means leicht umzusetzen und relativ leistungsfähig, um verdächtige Fälle vorherzusagen. Es ist ein guter Algorithmus, um bei Fraud-Detection-Problemen einzusteigen. Betrugsdaten sind jedoch oft sehr groß, besonders wenn du mit Transaktionsdaten arbeitest. MiniBatch K-Means ist eine effiziente Möglichkeit, K-Means auf einem großen Datensatz anzuwenden — und genau das nutzt du in dieser Übung.

Die skalierten Daten aus der vorherigen Übung, X_scaled, stehen bereit. Probier es aus.

Diese Übung ist Teil des Kurses

Betrugserkennung mit Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere MiniBatchKMeans aus sklearn.
  • Initialisiere das Minibatch-K-Means-Modell mit 8 Clustern.
  • Trainiere das Modell auf deinen skalierten Daten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)
Code bearbeiten und ausführen