Quantos cachos de grãos você tem?
No vídeo, você aprendeu a escolher um bom número de clusters para um conjunto de dados usando o gráfico de inércia k-means. Você recebe uma matriz samples contendo as medidas (como área, perímetro, comprimento e várias outras) de amostras de grãos. Qual é um bom número de clusters nesse caso?
KMeans e PyPlot (plt) já foram importados para você.
Esse conjunto de dados foi obtido no UCI Machine Learning Repository.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
Para cada um dos valores fornecidos de
k, execute as seguintes etapas:Crie uma instância
KMeanschamadamodelcom clustersk.Ajuste o modelo aos dados de grãos
samples.Acrescente o valor do atributo
inertia_demodelà listainertias.O código para plotar
ksvsinertiasfoi escrito para você, então clique em enviar para ver o gráfico!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()