LoslegenKostenlos loslegen

Wie viele Getreidebüschel?

Im Video hast du gelernt, wie du mit Hilfe des k-means Trägheitsdiagramms eine gute Anzahl von Clustern für einen Datensatz auswählen kannst. Du erhältst ein Array samples, das die Maße (wie Fläche, Umfang, Länge und andere) von Getreideproben enthält. Was ist in diesem Fall eine gute Anzahl von Clustern?

KMeans und PyPlot (plt) sind bereits für dich importiert worden.

Dieser Datensatz stammt aus dem UCI Machine Learning Repository.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Führe für jeden der angegebenen Werte von k die folgenden Schritte durch:

  • Erstelle eine KMeans Instanz namens model mit k Clustern.

  • Passe das Modell an die Getreidedaten an samples.

  • Füge den Wert des Attributs inertia_ von model an die Liste inertias an.

  • Der Code für die Darstellung von ks gegen inertias wurde für dich geschrieben, also klicke auf "Senden", um die Darstellung zu sehen!

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Code bearbeiten und ausführen