LoslegenKostenlos loslegen

Gleichförmige Cluster-Muster

Jetzt, da du den Einfluss von Seeds kennst, schauen wir uns die Tendenz von k-means an, gleichförmige Cluster zu bilden.

Für die nächste Übung verwenden wir einen mausähnlichen Datensatz. Ein mausähnlicher Datensatz besteht aus Punktgruppen, die dem Kopf einer Maus ähneln: drei in Kreisen angeordnete Cluster, eines für das Gesicht und zwei für die Ohren der Maus.

So sieht ein typischer mausähnlicher Datensatz aus (Quelle).

Die Daten sind in einem pandas-DataFrame mouse gespeichert. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten der Datenpunkte.

Diese Übung ist Teil des Kurses

Cluster Analysis in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere die Funktionen kmeans und vq aus SciPy.
  • Erzeuge Cluster-Zentren mit der Funktion kmeans() für drei Cluster.
  • Erstelle Cluster-Labels mit vq() unter Verwendung der oben erzeugten Cluster-Zentren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the kmeans and vq functions
____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = mouse)
plt.show()
Code bearbeiten und ausführen