Clustering gerarchico: metodo single
Usiamo lo stesso insieme di dati sul footfall e verifichiamo se si notano cambiamenti usando un metodo diverso per il clustering.
I dati sono in un DataFrame di pandas, comic_con. x_scaled e y_scaled sono i nomi delle colonne con le coordinate X e Y standardizzate delle persone in un dato momento.
Questo esercizio fa parte del corso
Analisi di cluster in Python
Istruzioni dell'esercizio
- Importa
fclusterelinkagedascipy.cluster.hierarchy. - Usa il metodo
singlenella funzionelinkage().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the fcluster and linkage functions
from ____ import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[[____, ____]], ____ = ____, metric = ____)
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, ____)
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()