Analisis silhouette
Analisis silhouette memungkinkan Anda menghitung seberapa mirip setiap observasi dengan klaster tempatnya ditetapkan relatif terhadap klaster lain. Metrik ini (lebar silhouette) berkisar dari -1 hingga 1 untuk setiap observasi dalam data Anda dan dapat ditafsirkan sebagai berikut:
- Nilai mendekati 1 menunjukkan bahwa observasi sangat sesuai dengan klaster yang ditetapkan
- Nilai mendekati 0 menunjukkan bahwa observasi berada di batas antara dua klaster
- Nilai mendekati -1 menunjukkan bahwa observasi mungkin ditetapkan ke klaster yang salah
Dalam latihan ini Anda akan memanfaatkan fungsi pam() dan silhouette() dari pustaka cluster untuk melakukan analisis silhouette guna membandingkan hasil model dengan k = 2 dan k = 3. Anda akan terus bekerja dengan himpunan data lineup.
Perhatikan dengan saksama plot silhouette, apakah setiap observasi jelas termasuk ke klaster yang ditetapkan untuk k = 3?
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Bangun model k-means
pam_k2menggunakanpam()dengank = 2pada datalineup. - Plot analisis silhouette menggunakan
plot(silhouette(model)). - Ulangi dua langkah pertama untuk
k = 3, simpan model sebagaipam_k3. - Pastikan untuk meninjau perbedaan antara plot sebelum melanjutkan (terutama observasi 3) untuk
pam_k3.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(cluster)
# Generate a k-means model using the pam() function with a k = 2
pam_k2 <- pam(___, k = ___)
# Plot the silhouette visual for the pam_k2 model
plot(silhouette(___))
# Generate a k-means model using the pam() function with a k = 3
pam_k3 <- ___
# Plot the silhouette visual for the pam_k3 model