Agrupamento hierárquico: método único
Vamos usar o mesmo conjunto de dados de pegadas e verificar se há alguma alteração se usarmos um método diferente de agrupamento.
Os dados são armazenados em um DataFrame do pandas, comic_con
. x_scaled
e y_scaled
são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento.
Este exercício faz parte do curso
Análise de cluster em Python
Instruções de exercício
- Importe
fcluster
elinkage
descipy.cluster.hierarchy
. - Use o método
single
na funçãolinkage()
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import the fcluster and linkage functions
from ____ import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[[____, ____]], ____ = ____, metric = ____)
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, ____)
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()