LoslegenKostenlos loslegen

Hierarchisches Clustering: Ward-Methode

Es ist Zeit für die Comic-Con! Die Comic-Con ist eine jährliche Comic-Messe, die in großen Städten weltweit stattfindet. Du hast die Daten zum Fußverkehr vom letzten Jahr, also die Anzahl der Personen auf dem Messegelände zu einem bestimmten Zeitpunkt. Du möchtest den Standort deines Stands so wählen, dass du den Umsatz maximierst. Nutze die Ward-Methode und wende hierarchisches Clustering an, um die zwei Anziehungspunkte im Gelände zu finden.

Die Daten liegen in einem pandas DataFrame comic_con. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten der Personen zu einem gegebenen Zeitpunkt.

Diese Übung ist Teil des Kurses

Cluster Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere fcluster und linkage aus scipy.cluster.hierarchy.
  • Verwende die Methode ward in der Funktion linkage().
  • Weise Clusterlabels zu, indem du aus distance_matrix 2 flache Cluster bildest.
  • Führe den Plot-Code aus, um die Ergebnisse zu sehen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the fcluster and linkage functions
from scipy.cluster.hierarchy import ____, ____

# Use the linkage() function
distance_matrix = ____(comic_con[['x_scaled', 'y_scaled']], ____ = ____, metric = 'euclidean')

# Assign cluster labels
comic_con['cluster_labels'] = ____(____, ____, criterion='maxclust')

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Code bearbeiten und ausführen