Aan de slagGa gratis aan de slag

Elbow-methode op duidelijke clusters

Laten we de comic con-gegevensset gebruiken om te zien hoe de elbow-plot eruitziet voor een gegevensset met duidelijke, goed afgebakende clusters. Je kunt de datapunten eerst visualiseren voordat je aan de oefening begint.

De data staat in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van mensen op een bepaald moment.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

distortions = []
num_clusters = range(1, 7)

# Create a list of distortions from the kmeans function
for i in ____:
    cluster_centers, distortion = ____
    distortions.append(distortion)

# Create a DataFrame with two lists - num_clusters, distortions
elbow_plot = pd.DataFrame({'num_clusters': ____, 'distortions': ____})

# Creat a line plot of num_clusters and distortions
sns.lineplot(x=____, y=____, data = ____)
plt.xticks(num_clusters)
plt.show()
Code bewerken en uitvoeren