Hierarchisches Clustering: single-Methode
Verwenden wir das gleiche Footfall-Dataset und prüfen, ob sich etwas ändert, wenn wir eine andere Methode für das Clustering verwenden.
Die Daten liegen in einem pandas-DataFrame comic_con. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten von Personen zu einem bestimmten Zeitpunkt.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Anleitung zur Übung
- Importiere
fclusterundlinkageausscipy.cluster.hierarchy. - Verwende die Methode
singlein der Funktionlinkage().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the fcluster and linkage functions
from ____ import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[[____, ____]], ____ = ____, metric = ____)
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, ____)
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()