LoslegenKostenlos loslegen

Wie viele Getreide-Cluster?

Im Video hast du gelernt, wie du mit dem k-means-Inertia-Diagramm eine gute Cluster-Anzahl für einen Datensatz auswählst. Dir steht ein Array namens samples mit Messwerten (zum Beispiel Fläche, Umfang, Länge und einigen weiteren) von Getreideproben zur Verfügung. Wie viele Cluster sind hier sinnvoll?

KMeans und PyPlot (plt) wurden bereits für dich importiert.

Dieser Datensatz stammt aus dem UCI Machine Learning Repository.

Diese Übung ist Teil des Kurses

Unsupervised Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Führe für jeden der gegebenen Werte von k die folgenden Schritte aus:
  • Erstelle eine KMeans-Instanz namens model mit k Clustern.
  • Fitte das Modell auf die Getreidedaten samples.
  • Hänge den Wert des Attributs inertia_ von model an die Liste inertias an.
  • Der Code, um ks gegen inertias zu plotten, wurde bereits für dich geschrieben. Klicke auf Antworten, um den Plot zu sehen!

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Code bearbeiten und ausführen