LoslegenKostenlos starten

Wie viele Getreide-Cluster?

Im Video hast du gelernt, wie du mit dem k-means-Inertia-Diagramm eine gute Cluster-Anzahl für einen Datensatz auswählst. Dir steht ein Array namens samples mit Messwerten (zum Beispiel Fläche, Umfang, Länge und einigen weiteren) von Getreideproben zur Verfügung. Wie viele Cluster sind hier sinnvoll?

KMeans und PyPlot (plt) wurden bereits für dich importiert.

Dieser Datensatz stammt aus dem UCI Machine Learning Repository.

Diese Übung ist Teil des Kurses

<Kurs>Unsupervised Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Führe für jeden der gegebenen Werte von k die folgenden Schritte aus:
  • Erstelle eine KMeans-Instanz namens model mit k Clustern.
  • Fitte das Modell auf die Getreidedaten samples.
  • Hänge den Wert des Attributs inertia_ von model an die Liste inertias an.
  • Der Code, um ks gegen inertias zu plotten, wurde bereits für dich geschrieben. Klicke auf Antworten, um den Plot zu sehen!

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Code bearbeiten und ausführen