Aan de slagGa gratis aan de slag

Invloed van seeds op verschillende clusters

Je merkte het effect van seeds op een gegevensset zonder duidelijk afgebakende clusters. In deze oefening onderzoek je of seeds ook invloed hebben op de clusters in de Comic Con-data, waar de clusters wél duidelijk gedefinieerd zijn.

De data staat in een pandas DataFrame, comic_con. x_scaled en y_scaled zijn de kolomnamen van de gestandaardiseerde X- en Y-coördinaten van mensen op een bepaald moment.

Deze oefening maakt deel uit van de cursus

Clusteranalyse in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import random class
____

# Initialize seed
random.____(____)

# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)

# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Code bewerken en uitvoeren