ComeçarComece de graça

Quantos cachos de grãos você tem?

No vídeo, você aprendeu a escolher um bom número de clusters para um conjunto de dados usando o gráfico de inércia k-means. Você recebe uma matriz samples contendo as medidas (como área, perímetro, comprimento e várias outras) de amostras de grãos. Qual é um bom número de clusters nesse caso?

KMeans e PyPlot (plt) já foram importados para você.

Esse conjunto de dados foi obtido no UCI Machine Learning Repository.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Para cada um dos valores fornecidos de k, execute as seguintes etapas:

  • Crie uma instância KMeans chamada model com clusters k.

  • Ajuste o modelo aos dados de grãos samples.

  • Acrescente o valor do atributo inertia_ de model à lista inertias.

  • O código para plotar ks vs inertias foi escrito para você, então clique em enviar para ver o gráfico!

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

ks = range(1, 6)
inertias = []

for k in ks:
    # Create a KMeans instance with k clusters: model
    ____
    
    # Fit model to samples
    ____
    
    # Append the inertia to the list of inertias
    ____
    
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()
Editar e executar o código