Aan de slagGa gratis aan de slag

Hoeveel graanclusters?

In de video heb je geleerd hoe je een goed aantal clusters kiest voor een gegevensset met behulp van de k-means-inertia-grafiek. Je krijgt een array samples met metingen (zoals oppervlakte, omtrek, lengte en andere) van graanmonsters. Wat is in dit geval een goed aantal clusters?

KMeans en PyPlot (plt) zijn al voor je geïmporteerd.

Deze gegevensset komt uit de UCI Machine Learning Repository.

Deze oefening maakt deel uit van de cursus

Unsupervised Learning in Python

Cursus bekijken

Oefeninstructies

  • Voer voor elk van de gegeven waarden van k het volgende uit:
  • Maak een KMeans-instantie genaamd model met k clusters.
  • Fit het model op de graandata samples.
  • Voeg de waarde van het attribuut inertia_ van model toe aan de lijst inertias.
  • De code om ks tegen inertias te plotten is al voor je geschreven, dus klik op Antwoord verzenden om de plot te zien!

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Code bewerken en uitvoeren