MulaiMulai sekarang secara gratis

Pola pengelompokan seragam

Sekarang setelah Anda memahami dampak seed, mari kita lihat bias pada k-means clustering yang cenderung membentuk klaster yang seragam.

Mari gunakan himpunan data berbentuk tikus untuk latihan berikutnya. Himpunan data berbentuk tikus adalah sekumpulan titik yang menyerupai kepala tikus: terdapat tiga klaster titik yang tersusun melingkar, masing-masing untuk wajah dan dua telinga tikus.

Berikut tampilan tipikal himpunan data berbentuk tikus (Sumber).

Data disimpan dalam pandas DataFrame, mouse. x_scaled dan y_scaled adalah nama kolom untuk koordinat X dan Y yang telah distandardisasi dari titik data.

Latihan ini adalah bagian dari kursus

Analisis Klaster di Python

Lihat Kursus

Petunjuk latihan

  • Impor fungsi kmeans dan vq di SciPy.
  • Hasilkan pusat klaster menggunakan fungsi kmeans() dengan tiga klaster.
  • Buat label klaster dengan vq() menggunakan pusat klaster yang dihasilkan di atas.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the kmeans and vq functions
____

# Generate cluster centers
cluster_centers, distortion = ____

# Assign cluster labels
mouse['cluster_labels'], distortion_list = ____

# Plot clusters
sns.scatterplot(x='x_scaled', y='y_scaled', 
                hue='cluster_labels', data = mouse)
plt.show()
Edit dan Jalankan Kode