Wie viele Getreide-Cluster?
Im Video hast du gelernt, wie du mit dem k-means-Inertia-Diagramm eine gute Cluster-Anzahl für einen Datensatz auswählst. Dir steht ein Array namens samples mit Messwerten (zum Beispiel Fläche, Umfang, Länge und einigen weiteren) von Getreideproben zur Verfügung. Wie viele Cluster sind hier sinnvoll?
KMeans und PyPlot (plt) wurden bereits für dich importiert.
Dieser Datensatz stammt aus dem UCI Machine Learning Repository.
Diese Übung ist Teil des Kurses
<Kurs>Unsupervised Learning in Python</Kurs>Übungsanweisungen
- Führe für jeden der gegebenen Werte von
kdie folgenden Schritte aus: - Erstelle eine
KMeans-Instanz namensmodelmitkClustern. - Fitte das Modell auf die Getreidedaten
samples. - Hänge den Wert des Attributs
inertia_vonmodelan die Listeinertiasan. - Der Code, um
ksgegeninertiaszu plotten, wurde bereits für dich geschrieben. Klicke auf Antworten, um den Plot zu sehen!
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()