K-means: Rata-Rata Lebar Siluet
Jadi, pengelompokan hierarkis menghasilkan 3 klaster dan metode siku menyarankan 2. Pada latihan ini, gunakan rata-rata lebar siluet untuk menelusuri nilai k yang paling "baik" seharusnya berapa.
Latihan ini adalah bagian dari kursus
Analisis Klaster di R
Petunjuk latihan
- Gunakan
map_dbl()untuk menjalankanpam()menggunakan dataoesuntuk nilai k dari 2 hingga 10 dan ekstrak nilai rata-rata lebar siluet dari setiap model:model$silinfo$avg.width. Simpan vektor hasilnya sebagaisil_width. - Bangun data frame baru
sil_dfyang memuat nilai k dan vektor rata-rata lebar siluet. - Gunakan nilai dalam
sil_dfuntuk membuat plot garis yang menunjukkan hubungan antara k dan rata-rata lebar siluet.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Use map_dbl to run many models with varying value of k
sil_width <- map_dbl(2:10, function(k){
model <- pam(___, k = ___)
model$silinfo$avg.width
})
# Generate a data frame containing both k and sil_width
sil_df <- data.frame(
k = ___,
sil_width = ___
)
# Plot the relationship between k and sil_width
ggplot(___, aes(x = ___, y = ___)) +
geom_line() +
scale_x_continuous(breaks = 2:10)