Avistamentos de Pokémon: agrupamento hierárquico
Vamos continuar a investigação sobre os avistamentos de Pokémon lendários do exercício anterior. Lembre-se de que, no gráfico de dispersão do exercício anterior, você identificou duas áreas em que os avistamentos de Pokémon eram densos. Isso significa que os pontos parecem se separar em dois grupos. Neste exercício, você formará dois grupos de avistamentos usando o agrupamento hierárquico.
'x'
e 'y'
são colunas de coordenadas X e Y dos locais de observação, armazenadas em um DataFrame da pandas, df
. Os seguintes estão disponíveis para uso: matplotlib.pyplot
como plt
, seaborn
como sns
, e pandas
como pd
.
Este exercício faz parte do curso
Análise de cluster em Python
Instruções de exercício
- Importe as bibliotecas
linkage
efcluster
. - Use a função
linkage()
para calcular as distâncias usando o método ward. - Gere rótulos de cluster para cada ponto de dados com dois clusters usando a função
fcluster()
. - Trace os pontos com o seaborn e atribua uma cor diferente a cada cluster.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import linkage and fcluster functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function to compute distance
Z = ____(____, 'ward')
# Generate cluster labels
df['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot the points with seaborn
sns.scatterplot(x=____, y=____, hue=____, data=df)
plt.show()