Elbow-Methode bei klar getrennten Clustern
Schauen wir uns das Comic-Con-Dataset an, um zu sehen, wie das Elbow-Diagramm bei einem Datensatz mit klaren, gut definierten Clustern aussieht. Du kannst dir die Datenpunkte anzeigen lassen, bevor du mit der Übung fortfährst.
Die Daten sind in einem pandas-DataFrame comic_con gespeichert. x_scaled und y_scaled sind die Spaltennamen der standardisierten X- und Y-Koordinaten von Personen zu einem bestimmten Zeitpunkt.
Diese Übung ist Teil des Kurses
Cluster Analysis in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(distortion)
# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()