Clustering jerárquico: método ward
¡Es hora de la Comic-Con! La Comic-Con es una convención anual sobre cómics que se celebra en grandes ciudades del mundo. Tienes los datos del aforo del año pasado, es decir, el número de personas en el recinto de la convención en un momento dado. Quieres decidir dónde colocar tu puesto para maximizar las ventas. Usando el método ward, aplica clustering jerárquico para encontrar los dos puntos de atracción en el área.
Los datos están guardados en un DataFrame de pandas, comic_con. x_scaled y y_scaled son los nombres de las columnas con las coordenadas X e Y estandarizadas de las personas en un instante dado.
Este ejercicio forma parte del curso
Análisis de clústeres en Python
Instrucciones del ejercicio
- Importa
fclusterylinkagedescipy.cluster.hierarchy. - Usa el método
warden la funciónlinkage(). - Asigna etiquetas de clúster formando 2 clústeres planos a partir de
distance_matrix. - Ejecuta el código de visualización para ver los resultados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()