Wie viele Getreidebüschel?
Im Video hast du gelernt, wie du mit Hilfe des k-means Trägheitsdiagramms eine gute Anzahl von Clustern für einen Datensatz auswählen kannst. Du erhältst ein Array samples
, das die Maße (wie Fläche, Umfang, Länge und andere) von Getreideproben enthält. Was ist in diesem Fall eine gute Anzahl von Clustern?
KMeans
und PyPlot (plt
) sind bereits für dich importiert worden.
Dieser Datensatz stammt aus dem UCI Machine Learning Repository.
Diese Übung ist Teil des Kurses
Unüberwachtes Lernen in Python
Anleitung zur Übung
Führe für jeden der angegebenen Werte von
k
die folgenden Schritte durch:Erstelle eine
KMeans
Instanz namensmodel
mitk
Clustern.Passe das Modell an die Getreidedaten an
samples
.Füge den Wert des Attributs
inertia_
vonmodel
an die Listeinertias
an.Der Code für die Darstellung von
ks
gegeninertias
wurde für dich geschrieben, also klicke auf "Senden", um die Darstellung zu sehen!
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()