Agrupación jerárquica: método ward
¡Ha llegado la hora de la Comic-Con! La Comic-Con es una convención anual basada en el cómic que se celebra en las principales ciudades del mundo. Tienes los datos de afluencia del año pasado, el número de personas en el recinto de la convención en un momento dado. Te gustaría decidir la ubicación de tu puesto para maximizar las ventas. Utilizando el método de la sala, aplica la agrupación jerárquica para encontrar los dos puntos de atracción de la zona.
Los datos se almacenan en un DataFrame de pandas, comic_con
. x_scaled
y y_scaled
son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Instrucciones de ejercicio
- Importa
fcluster
ylinkage
descipy.cluster.hierarchy
. - Utiliza el método
ward
en la funciónlinkage()
. - Asigna etiquetas a los conglomerados formando 2 conglomerados planos a partir de
distance_matrix
. - Ejecuta el código de trazado para ver los resultados.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()