ComeçarComece gratuitamente

Agrupamento hierárquico: método completo

Pela terceira e última vez, vamos usar o mesmo conjunto de dados de pegadas e verificar se há alguma alteração se usarmos um método diferente de agrupamento.

Os dados são armazenados em um DataFrame do pandas, comic_con. x_scaled e y_scaled são os nomes das colunas das coordenadas X e Y padronizadas das pessoas em um determinado momento.

Este exercício faz parte do curso

Análise de cluster em Python

Ver Curso

Instruções de exercício

  • Importe fcluster e linkage de scipy.cluster.hierarchy.
  • Use o método complete na função .linkage().

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import the fcluster and linkage functions
____

# Use the linkage() function
distance_matrix = ____(____, ____, ____)

# Assign cluster labels
comic_con['cluster_labels'] = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Editar e executar código