ComeçarComece de graça

Padrões uniformes de agrupamento

Agora que você já conhece o impacto das sementes, vamos analisar a tendência do agrupamento k-means para a formação de agrupamentos uniformes.

Vamos usar um conjunto de dados do tipo mouse para nosso próximo exercício. Um conjunto de dados semelhante a um rato é um grupo de pontos que se assemelha à cabeça de um rato: ele tem três grupos de pontos dispostos em círculos, um para o rosto e dois para as orelhas de um rato.

Aqui está a aparência de um conjunto de dados típico do tipo mouse(Fonte).

Os dados são armazenados em um DataFrame do pandas, mouse. x_scaled e y_scaled são os nomes das colunas das coordenadas X e Y padronizadas dos pontos de dados.

Este exercício faz parte do curso

Análise de cluster em Python

Ver curso

Instruções do exercício

  • Importe as funções kmeans e vq no SciPy.
  • Gere centros de cluster usando a função kmeans() com três clusters.
  • Crie rótulos de cluster com vq() com os centros de cluster gerados acima.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the kmeans and vq functions
____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = mouse)
plt.show()
Editar e executar o código