LoslegenKostenlos loslegen

Einfluss von Seeds auf unterschiedliche Cluster

Du hast den Einfluss von Seeds auf einen Datensatz beobachtet, der keine klar abgegrenzten Cluster-Gruppen hatte. In dieser Übung findest du heraus, ob Seeds die Cluster in den Comic-Con-Daten beeinflussen, bei denen die Cluster gut definiert sind.

Die Daten liegen in einem pandas DataFrame comic_con. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten von Personen zu einem bestimmten Zeitpunkt.

Diese Übung ist Teil des Kurses

Cluster Analysis in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import random class
____

# Initialize seed
random.____(____)

# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)

# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Code bearbeiten und ausführen