LoslegenKostenlos loslegen

Elbow-Methode

In der vorherigen Übung hast du MiniBatch K-means mit 8 Clustern implementiert, ohne eigentlich zu prüfen, wie viele Cluster sinnvoll sind. Für unseren ersten Ansatz zur Betrugserkennung ist es wichtig, die richtige Anzahl an Clustern zu wählen, besonders wenn du die Ausreißer dieser Cluster als Betrugsprognosen verwenden willst. Um zu entscheiden, wie viele Cluster du verwenden wirst, wenden wir die Elbow-Methode an und schauen, welche Clusterzahl nach dieser Methode optimal ist.

X_scaled steht dir wieder zur Verfügung und MiniBatchKMeans wurde aus sklearn importiert.

Diese Übung ist Teil des Kurses

Betrugserkennung mit Python

Kurs anzeigen

Anleitung zur Übung

  • Lege den Bereich auf 1 bis 5 Cluster fest.
  • Führe MiniBatch K-means für alle Clusterzahlen im Bereich per List Comprehension aus.
  • Fitte jedes Modell auf die skalierten Daten und ermittle die Scores auf den skalierten Daten.
  • Plotte die Clusterzahlen und ihre jeweiligen Scores; die Ausführung dauert ein paar Sekunden.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define the range of clusters to try
clustno = range(____, ____)

# Run MiniBatch Kmeans over the number of clusters
kmeans = [____(n_clusters=i, random_state=0) for ____ in ____]

# Obtain the score for each model
score = [kmeans[i].fit(____).score(____) for i in range(len(kmeans))]

# Plot the models and their respective score 
plt.plot(____, ____)
plt.xlabel('Number of Clusters')
plt.ylabel('Score')
plt.title('Elbow Curve')
plt.show()
Code bearbeiten und ausführen