Hierarchisches Clustering: Ward-Methode
Es ist Zeit für die Comic-Con! Die Comic-Con ist eine jährliche Comic-Messe, die in großen Städten weltweit stattfindet. Du hast die Daten zum Fußverkehr vom letzten Jahr, also die Anzahl der Personen auf dem Messegelände zu einem bestimmten Zeitpunkt. Du möchtest den Standort deines Stands so wählen, dass du den Umsatz maximierst. Nutze die Ward-Methode und wende hierarchisches Clustering an, um die zwei Anziehungspunkte im Gelände zu finden.
Die Daten liegen in einem pandas DataFrame comic_con. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten der Personen zu einem gegebenen Zeitpunkt.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Anleitung zur Übung
- Importiere
fclusterundlinkageausscipy.cluster.hierarchy. - Verwende die Methode
wardin der Funktionlinkage(). - Weise Clusterlabels zu, indem du aus
distance_matrix2 flache Cluster bildest. - Führe den Plot-Code aus, um die Ergebnisse zu sehen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____
# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')
# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()