Agrupación jerárquica: método único
Utilicemos el mismo conjunto de datos de pisadas y comprobemos si se observan cambios si utilizamos un método diferente para la agrupación.
Los datos se almacenan en un DataFrame de pandas, comic_con
. x_scaled
y y_scaled
son los nombres de columna de las coordenadas X e Y normalizadas de las personas en un momento dado.
Este ejercicio forma parte del curso
Análisis de conglomerados en Python
Instrucciones del ejercicio
- Importa
fcluster
ylinkage
descipy.cluster.hierarchy
. - Utiliza el método
single
en la funciónlinkage()
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the fcluster and linkage functions
from ____ import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[[____, ____]], ____ = ____, metric = ____)
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, ____)
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()