CommencerCommencer gratuitement

Clustering hiérarchique : méthode single

Réutilisons le même jeu de données de fréquentation et vérifions si des changements apparaissent lorsque nous utilisons une autre méthode de clustering.

Les données sont stockées dans un DataFrame pandas, comic_con. x_scaled et y_scaled sont les noms de colonnes des coordonnées X et Y standardisées des personnes à un instant donné.

Cet exercice fait partie du cours

Analyse de clusters en Python

Afficher le cours

Instructions

  • Importez fcluster et linkage depuis scipy.cluster.hierarchy.
  • Utilisez la méthode single dans la fonction linkage().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the fcluster and linkage functions
from ____ import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[[____, ____]], ____ = ____, metric = ____)

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, ____)

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Modifier et exécuter le code