ComenzarEmpieza gratis

Clustering jerárquico: método ward

¡Es hora de la Comic-Con! La Comic-Con es una convención anual sobre cómics que se celebra en grandes ciudades del mundo. Tienes los datos del aforo del año pasado, es decir, el número de personas en el recinto de la convención en un momento dado. Quieres decidir dónde colocar tu puesto para maximizar las ventas. Usando el método ward, aplica clustering jerárquico para encontrar los dos puntos de atracción en el área.

Los datos están guardados en un DataFrame de pandas, comic_con. x_scaled y y_scaled son los nombres de las columnas con las coordenadas X e Y estandarizadas de las personas en un instante dado.

Este ejercicio forma parte del curso

Análisis de clústeres en Python

Ver curso

Instrucciones del ejercicio

  • Importa fcluster y linkage de scipy.cluster.hierarchy.
  • Usa el método ward en la función linkage().
  • Asigna etiquetas de clúster formando 2 clústeres planos a partir de distance_matrix.
  • Ejecuta el código de visualización para ver los resultados.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Editar y ejecutar código