Analisis silhouette
Analisis silhouette memungkinkan Anda menghitung seberapa mirip setiap observasi dengan klaster tempatnya ditetapkan relatif terhadap klaster lain. Metrik ini (lebar silhouette) berkisar dari -1 hingga 1 untuk setiap observasi dalam data Anda dan dapat ditafsirkan sebagai berikut:
- Nilai mendekati 1 menunjukkan bahwa observasi sangat sesuai dengan klaster yang ditetapkan
- Nilai mendekati 0 menunjukkan bahwa observasi berada di batas antara dua klaster
- Nilai mendekati -1 menunjukkan bahwa observasi mungkin ditetapkan ke klaster yang salah
Dalam latihan ini Anda akan memanfaatkan fungsi pam() dan silhouette() dari pustaka cluster untuk melakukan analisis silhouette guna membandingkan hasil model dengan k = 2 dan k = 3. Anda akan terus bekerja dengan himpunan data lineup.
Perhatikan dengan saksama plot silhouette, apakah setiap observasi jelas termasuk ke klaster yang ditetapkan untuk k = 3?
Latihan ini merupakan bagian dari kursus
Analisis Klaster di R
Instruksi latihan
- Bangun model k-means
pam_k2menggunakanpam()dengank = 2pada datalineup. - Plot analisis silhouette menggunakan
plot(silhouette(model)). - Ulangi dua langkah pertama untuk
k = 3, simpan model sebagaipam_k3. - Pastikan untuk meninjau perbedaan antara plot sebelum melanjutkan (terutama observasi 3) untuk
pam_k3.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
library(cluster)
# Generate a k-means model using the pam() function with a k = 2
pam_k2 <- pam(___, k = ___)
# Plot the silhouette visual for the pam_k2 model
plot(silhouette(___))
# Generate a k-means model using the pam() function with a k = 3
pam_k3 <- ___
# Plot the silhouette visual for the pam_k3 model