MulaiMulai sekarang secara gratis

Analisis silhouette

Analisis silhouette memungkinkan Anda menghitung seberapa mirip setiap observasi dengan klaster tempatnya ditetapkan relatif terhadap klaster lain. Metrik ini (lebar silhouette) berkisar dari -1 hingga 1 untuk setiap observasi dalam data Anda dan dapat ditafsirkan sebagai berikut:

  • Nilai mendekati 1 menunjukkan bahwa observasi sangat sesuai dengan klaster yang ditetapkan
  • Nilai mendekati 0 menunjukkan bahwa observasi berada di batas antara dua klaster
  • Nilai mendekati -1 menunjukkan bahwa observasi mungkin ditetapkan ke klaster yang salah

Dalam latihan ini Anda akan memanfaatkan fungsi pam() dan silhouette() dari pustaka cluster untuk melakukan analisis silhouette guna membandingkan hasil model dengan k = 2 dan k = 3. Anda akan terus bekerja dengan himpunan data lineup.

Perhatikan dengan saksama plot silhouette, apakah setiap observasi jelas termasuk ke klaster yang ditetapkan untuk k = 3?

Latihan ini adalah bagian dari kursus

Analisis Klaster di R

Lihat Kursus

Petunjuk latihan

  • Bangun model k-means pam_k2 menggunakan pam() dengan k = 2 pada data lineup.
  • Plot analisis silhouette menggunakan plot(silhouette(model)).
  • Ulangi dua langkah pertama untuk k = 3, simpan model sebagai pam_k3.
  • Pastikan untuk meninjau perbedaan antara plot sebelum melanjutkan (terutama observasi 3) untuk pam_k3.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

library(cluster)

# Generate a k-means model using the pam() function with a k = 2
pam_k2 <- pam(___, k = ___)

# Plot the silhouette visual for the pam_k2 model
plot(silhouette(___))

# Generate a k-means model using the pam() function with a k = 3
pam_k3 <- ___

# Plot the silhouette visual for the pam_k3 model

Edit dan Jalankan Kode