Gleichförmige Cluster-Muster
Jetzt, da du den Einfluss von Seeds kennst, schauen wir uns die Tendenz von k-means an, gleichförmige Cluster zu bilden.
Für die nächste Übung verwenden wir einen mausähnlichen Datensatz. Ein mausähnlicher Datensatz besteht aus Punktgruppen, die dem Kopf einer Maus ähneln: drei in Kreisen angeordnete Cluster, eines für das Gesicht und zwei für die Ohren der Maus.
So sieht ein typischer mausähnlicher Datensatz aus (Quelle).
Die Daten sind in einem pandas-DataFrame mouse gespeichert. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten der Datenpunkte.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Anleitung zur Übung
- Importiere die Funktionen
kmeansundvqaus SciPy. - Erzeuge Cluster-Zentren mit der Funktion
kmeans()für drei Cluster. - Erstelle Cluster-Labels mit
vq()unter Verwendung der oben erzeugten Cluster-Zentren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the kmeans and vq functions
____
# Generate cluster centers
cluster_centers, distortion = ____
# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = mouse)
plt.show()