Wie viele Getreide-Cluster?
Im Video hast du gelernt, wie du mit dem k-means-Inertia-Diagramm eine gute Cluster-Anzahl für einen Datensatz auswählst. Dir steht ein Array namens samples mit Messwerten (zum Beispiel Fläche, Umfang, Länge und einigen weiteren) von Getreideproben zur Verfügung. Wie viele Cluster sind hier sinnvoll?
KMeans und PyPlot (plt) wurden bereits für dich importiert.
Dieser Datensatz stammt aus dem UCI Machine Learning Repository.
Diese Übung ist Teil des Kurses
Unsupervised Learning in Python
Anleitung zur Übung
- Führe für jeden der gegebenen Werte von
kdie folgenden Schritte aus: - Erstelle eine
KMeans-Instanz namensmodelmitkClustern. - Fitte das Modell auf die Getreidedaten
samples. - Hänge den Wert des Attributs
inertia_vonmodelan die Listeinertiasan. - Der Code, um
ksgegeninertiaszu plotten, wurde bereits für dich geschrieben. Klicke auf Antworten, um den Plot zu sehen!
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()