Dampak seed pada klaster yang berbeda
Anda telah melihat dampak seed pada himpunan data yang tidak memiliki kelompok klaster yang terdefinisi dengan baik. Dalam latihan ini, Anda akan menelusuri apakah seed memengaruhi klaster pada data Comic Con, yang klasternya terdefinisi dengan baik.
Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari orang-orang pada waktu tertentu.
Latihan ini adalah bagian dari kursus
Analisis Klaster di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import random class
____
# Initialize seed
random.____(____)
# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)
# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = comic_con)
plt.show()