IniziaInizia gratis

Clustering gerarchico: metodo complete

Per la terza e ultima volta, usiamo lo stesso insieme di dati sui flussi di persone e vediamo se ci sono differenze usando un metodo di clustering diverso.

I dati sono in un DataFrame di pandas, comic_con. x_scaled e y_scaled sono i nomi delle colonne con le coordinate X e Y standardizzate delle persone in un dato momento.

Questo esercizio fa parte del corso

Analisi di cluster in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa fcluster e linkage da scipy.cluster.hierarchy.
  • Usa il metodo complete nella funzione .linkage().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the fcluster and linkage functions
____

# Use the linkage() function
distance_matrix = ____(____, ____, ____)

# Assign cluster labels
comic_con['cluster_labels'] = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Modifica ed esegui il codice