ComeçarComece de graça

Quantos cachos de grãos?

No vídeo, você aprendeu como escolher um bom número de clusters para um conjunto de dados usando o gráfico de inércia k-means. Você recebe uma matriz samples com as medidas (como área, perímetro, comprimento e várias outras) de amostras de grãos. Qual é um bom número de clusters nesse caso?

KMeans e PyPlot (plt) já foram importados pra você.

Esse conjunto de dados veio do Repositório de Machine Learning da UCI.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Para cada um dos valores dados de k, faça o seguinte:

  • Crie uma instância do KMeans chamada model com clusters k.

  • Ajuste o modelo aos dados de grãos samples.

  • Adicione o valor do atributo inertia_ de model à lista inertias.

  • O código para plotar “ ks ” vs “ inertias ” já está pronto, então é só clicar em enviar para ver o gráfico!

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Editar e executar o código