Elbow-methode op duidelijke clusters
Laten we de comic con-gegevensset gebruiken om te zien hoe de elbow-plot eruitziet voor een gegevensset met duidelijke, goed afgebakende clusters. Je kunt de datapunten eerst visualiseren voordat je aan de oefening begint.
De data staat in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van mensen op een bepaald moment.
Deze oefening maakt deel uit van de cursus
Clusteranalyse in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
distortions = []
num_clusters = range(1, 7)
# Create a list of distortions from the kmeans function
for i in ____:
cluster_centers, distortion = ____
distortions.append(distortion)
# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})
# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()