MulaiMulai sekarang secara gratis

Dampak seed pada klaster yang berbeda

Anda telah melihat dampak seed pada himpunan data yang tidak memiliki kelompok klaster yang terdefinisi dengan baik. Dalam latihan ini, Anda akan menelusuri apakah seed memengaruhi klaster pada data Comic Con, yang klasternya terdefinisi dengan baik.

Data disimpan dalam pandas DataFrame, comic_con. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari orang-orang pada waktu tertentu.

Latihan ini adalah bagian dari kursus

Analisis Klaster di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import random class
____

# Initialize seed
random.____(____)

# Run kmeans clustering
cluster_centers, distortion = kmeans(comic_con[['x_scaled', 'y_scaled']], 2)
comic_con['cluster_labels'], distortion_list = vq(comic_con[['x_scaled', 'y_scaled']], cluster_centers)

# Plot the scatterplot
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = comic_con)
plt.show()
Edit dan Jalankan Kode