Hoeveel graanclusters?
In de video heb je geleerd hoe je een goed aantal clusters kiest voor een gegevensset met behulp van de k-means-inertia-grafiek. Je krijgt een array samples met metingen (zoals oppervlakte, omtrek, lengte en andere) van graanmonsters. Wat is in dit geval een goed aantal clusters?
KMeans en PyPlot (plt) zijn al voor je geïmporteerd.
Deze gegevensset komt uit de UCI Machine Learning Repository.
Deze oefening maakt deel uit van de cursus
Unsupervised Learning in Python
Oefeninstructies
- Voer voor elk van de gegeven waarden van
khet volgende uit: - Maak een
KMeans-instantie genaamdmodelmetkclusters. - Fit het model op de graandata
samples. - Voeg de waarde van het attribuut
inertia_vanmodeltoe aan de lijstinertias. - De code om
kstegeninertiaste plotten is al voor je geschreven, dus klik op Antwoord verzenden om de plot te zien!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()