Elbow-Methode bei gleichmäßig verteilten Daten
In der vorherigen Übung hast du ein Elbow-Diagramm für Daten mit klar abgegrenzten Clustern erstellt. Schauen wir uns nun an, wie das Elbow-Diagramm bei einem Datensatz mit gleichmäßig verteilten Punkten aussieht. Es kann hilfreich sein, die Datenpunkte anzuzeigen, bevor du mit der Übung fortfährst.
Die Daten liegen in einem pandas DataFrame uniform_data. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten der Punkte.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
distortions = []
num_clusters = range(2, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
____.append(____)
# Create a DataFrame with two lists - number of clusters and distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.____(x=____, y=____, data=____)
plt.xticks(num_clusters)
plt.show()