Quantos cachos de grãos você tem?
No vídeo, você aprendeu a escolher um bom número de clusters para um conjunto de dados usando o gráfico de inércia k-means. Você recebe uma matriz samples
contendo as medidas (como área, perímetro, comprimento e várias outras) de amostras de grãos. Qual é um bom número de clusters nesse caso?
KMeans
e PyPlot (plt
) já foram importados para você.
Esse conjunto de dados foi obtido no UCI Machine Learning Repository.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
Para cada um dos valores fornecidos de
k
, execute as seguintes etapas:Crie uma instância
KMeans
chamadamodel
com clustersk
.Ajuste o modelo aos dados de grãos
samples
.Acrescente o valor do atributo
inertia_
demodel
à listainertias
.O código para plotar
ks
vsinertias
foi escrito para você, então clique em enviar para ver o gráfico!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
ks = range(1, 6)
inertias = []
for k in ks:
# Create a KMeans instance with k clusters: model
____
# Fit model to samples
____
# Append the inertia to the list of inertias
____
# Plot ks vs inertias
plt.plot(ks, inertias, '-o')
plt.xlabel('number of clusters, k')
plt.ylabel('inertia')
plt.xticks(ks)
plt.show()