Padrões uniformes de agrupamento
Agora que você já conhece o impacto das sementes, vamos analisar a tendência do agrupamento k-means para a formação de agrupamentos uniformes.
Vamos usar um conjunto de dados do tipo mouse para nosso próximo exercício. Um conjunto de dados semelhante a um rato é um grupo de pontos que se assemelha à cabeça de um rato: ele tem três grupos de pontos dispostos em círculos, um para o rosto e dois para as orelhas de um rato.
Aqui está a aparência de um conjunto de dados típico do tipo mouse(Fonte).
Os dados são armazenados em um DataFrame do pandas, mouse
. x_scaled
e y_scaled
são os nomes das colunas das coordenadas X e Y padronizadas dos pontos de dados.
Este exercício faz parte do curso
Análise de cluster em Python
Instruções do exercício
- Importe as funções
kmeans
evq
no SciPy. - Gere centros de cluster usando a função
kmeans()
com três clusters. - Crie rótulos de cluster com
vq()
com os centros de cluster gerados acima.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the kmeans and vq functions
____
# Generate cluster centers
cluster_centers, distortion = ____
# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = mouse)
plt.show()