Agrupamento hierárquico: método ward
Chegou a hora da Comic-Con! A Comic-Con é uma convenção anual baseada em quadrinhos realizada nas principais cidades do mundo. Você tem os dados do footfall do ano passado, o número de pessoas no local da convenção em um determinado momento. Você gostaria de decidir o local da sua barraca para maximizar as vendas. Usando o método ward, aplique o agrupamento hierárquico para encontrar os dois pontos de atração na área.
Os dados são armazenados em um DataFrame do pandas, comic_con
. x_scaled
e y_scaled
são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento.
Este exercício faz parte do curso
Análise de cluster em Python
Instruções do exercício
- Importe
fcluster
elinkage
descipy.cluster.hierarchy
. - Use o método
ward
na funçãolinkage()
. - Atribua rótulos de clusters formando 2 clusters planos a partir de
distance_matrix
. - Execute o código de plotagem para ver os resultados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()