ComeçarComece gratuitamente

Avistamentos de Pokémon: agrupamento hierárquico

Vamos continuar a investigação sobre os avistamentos de Pokémon lendários do exercício anterior. Lembre-se de que, no gráfico de dispersão do exercício anterior, você identificou duas áreas em que os avistamentos de Pokémon eram densos. Isso significa que os pontos parecem se separar em dois grupos. Neste exercício, você formará dois grupos de avistamentos usando o agrupamento hierárquico.

'x' e 'y' são colunas de coordenadas X e Y dos locais de observação, armazenadas em um DataFrame da pandas, df. Os seguintes estão disponíveis para uso: matplotlib.pyplot como plt, seaborn como sns, e pandas como pd.

Este exercício faz parte do curso

Análise de cluster em Python

Ver Curso

Instruções de exercício

  • Importe as bibliotecas linkage e fcluster.
  • Use a função linkage() para calcular as distâncias usando o método ward.
  • Gere rótulos de cluster para cada ponto de dados com dois clusters usando a função fcluster().
  • Trace os pontos com o seaborn e atribua uma cor diferente a cada cluster.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import linkage and fcluster functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function to compute distance
Z = ____(____, 'ward')

# Generate cluster labels
df['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()
Editar e executar código