Pola pengelompokan seragam
Sekarang setelah Anda memahami dampak seed, mari kita lihat bias pada k-means clustering yang cenderung membentuk klaster yang seragam.
Mari gunakan himpunan data berbentuk tikus untuk latihan berikutnya. Himpunan data berbentuk tikus adalah sekumpulan titik yang menyerupai kepala tikus: terdapat tiga klaster titik yang tersusun melingkar, masing-masing untuk wajah dan dua telinga tikus.
Berikut tampilan tipikal himpunan data berbentuk tikus (Sumber).
Data disimpan dalam pandas DataFrame, mouse. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari titik data.
Latihan ini adalah bagian dari kursus
Analisis Klaster di Python
Petunjuk latihan
- Impor fungsi
kmeansdanvqdi SciPy. - Hasilkan pusat klaster menggunakan fungsi
kmeans()dengan tiga klaster. - Buat label klaster dengan
vq()menggunakan pusat klaster yang dihasilkan di atas.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the kmeans and vq functions
____
# Generate cluster centers
cluster_centers, distortion = ____
# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____
# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled',
hue='cluster_labels', data = mouse)
plt.show()