Wie viele Getreidebüschel?
Im Video hast du gelernt, wie du mit dem k-Means-Inertia-Diagramm eine gute Anzahl von Clustern für einen Datensatz auswählst. Du bekommst ein Array samples
mit den Messwerten (wie Fläche, Umfang, Länge und ein paar andere) von Getreieproben. Wie viele Cluster sind in diesem Fall sinnvoll?
KMeans
und PyPlot (plt
) wurden schon für dich importiert.
Dieser Datensatz kommt aus dem UCI Machine Learning Repository.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
Mach für jeden der angegebenen Werte von „
k
“ Folgendes:Erstell eine „
KMeans
“-Instanz namens „model
“ mit „k
“-Clustern.Passe das Modell an die Korngrößendaten an
samples
.Füge den Wert des Attributs „
inertia_
” von „model
” zur Liste „inertias
” hinzu.Der Code zum Zeichnen von „
ks
“ gegen „inertias
“ wurde für dich geschrieben. Klick einfach auf „Senden“, um die Grafik anzuzeigen!
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()