LoslegenKostenlos loslegen

Wie viele Getreidebüschel?

Im Video hast du gelernt, wie du mit dem k-Means-Inertia-Diagramm eine gute Anzahl von Clustern für einen Datensatz auswählst. Du bekommst ein Array samples mit den Messwerten (wie Fläche, Umfang, Länge und ein paar andere) von Getreieproben. Wie viele Cluster sind in diesem Fall sinnvoll?

KMeans und PyPlot (plt) wurden schon für dich importiert.

Dieser Datensatz kommt aus dem UCI Machine Learning Repository.

Diese Übung ist Teil des Kurses

Unüberwachtes Lernen in Python

Kurs anzeigen

Anleitung zur Übung

  • Mach für jeden der angegebenen Werte von „ k “ Folgendes:

  • Erstell eine „ KMeans “-Instanz namens „ model “ mit „ k “-Clustern.

  • Passe das Modell an die Korngrößendaten an samples.

  • Füge den Wert des Attributs „ inertia_ ” von „ model ” zur Liste „ inertias ” hinzu.

  • Der Code zum Zeichnen von „ ks “ gegen „ inertias “ wurde für dich geschrieben. Klick einfach auf „Senden“, um die Grafik anzuzeigen!

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Code bearbeiten und ausführen