IniziaInizia gratis

Quanti cluster di cereali?

Nel video hai visto come scegliere un buon numero di cluster per un insieme di dati usando il grafico dell'inerzia di k-means. Ti viene fornito un array samples che contiene le misure (come area, perimetro, lunghezza e altre) di campioni di cereali. Qual è un buon numero di cluster in questo caso?

KMeans e PyPlot (plt) sono già stati importati per te.

Questo insieme di dati proviene dall'UCI Machine Learning Repository.

Questo esercizio fa parte del corso

Apprendimento non supervisionato in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Per ognuno dei valori di k forniti, esegui i seguenti passaggi:
  • Crea un'istanza KMeans chiamata model con k cluster.
  • Adatta il modello ai dati dei cereali samples.
  • Aggiungi il valore dell'attributo inertia_ di model alla lista inertias.
  • Il codice per tracciare ks rispetto a inertias è già pronto: premi Invia per vedere il grafico!

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Modifica ed esegui il codice