Clustering hiérarchique : méthode complete
Pour la troisième et dernière fois, utilisons le même jeu de données de fréquentation et voyons si des changements apparaissent lorsque nous utilisons une autre méthode de clustering.
Les données sont stockées dans un DataFrame pandas, comic_con. x_scaled et y_scaled sont les noms des colonnes contenant les coordonnées X et Y standardisées des personnes à un instant donné.
Cet exercice fait partie du cours
Analyse de clusters en Python
Instructions
- Importez
fclusteretlinkagedepuisscipy.cluster.hierarchy. - Utilisez la méthode
completedans la fonction.linkage().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the fcluster and linkage functions
____
# Use the linkage() function
distance_matrix = ____(____, ____, ____)
# Assign cluster labels
comic_con['cluster_labels'] = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()