ComeçarComece de graça

Agrupamento hierárquico: método ward

Chegou a hora da Comic-Con! A Comic-Con é uma convenção anual baseada em quadrinhos realizada nas principais cidades do mundo. Você tem os dados do footfall do ano passado, o número de pessoas no local da convenção em um determinado momento. Você gostaria de decidir o local da sua barraca para maximizar as vendas. Usando o método ward, aplique o agrupamento hierárquico para encontrar os dois pontos de atração na área.

Os dados são armazenados em um DataFrame do pandas, comic_con. x_scaled e y_scaled são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento.

Este exercício faz parte do curso

Análise de cluster em Python

Ver curso

Instruções do exercício

  • Importe fcluster e linkage de scipy.cluster.hierarchy.
  • Use o método ward na função linkage().
  • Atribua rótulos de clusters formando 2 clusters planos a partir de distance_matrix.
  • Execute o código de plotagem para ver os resultados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Editar e executar o código