MulaiMulai sekarang secara gratis

K-means: Rata-Rata Lebar Siluet

Jadi, pengelompokan hierarkis menghasilkan 3 klaster dan metode siku menyarankan 2. Pada latihan ini, gunakan rata-rata lebar siluet untuk menelusuri nilai k yang paling "baik" seharusnya berapa.

Latihan ini adalah bagian dari kursus

Analisis Klaster di R

Lihat Kursus

Petunjuk latihan

  • Gunakan map_dbl() untuk menjalankan pam() menggunakan data oes untuk nilai k dari 2 hingga 10 dan ekstrak nilai rata-rata lebar siluet dari setiap model: model$silinfo$avg.width. Simpan vektor hasilnya sebagai sil_width.
  • Bangun data frame baru sil_df yang memuat nilai k dan vektor rata-rata lebar siluet.
  • Gunakan nilai dalam sil_df untuk membuat plot garis yang menunjukkan hubungan antara k dan rata-rata lebar siluet.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Use map_dbl to run many models with varying value of k
sil_width <- map_dbl(2:10,  function(k){
  model <- pam(___, k = ___)
  model$silinfo$avg.width
})

# Generate a data frame containing both k and sil_width
sil_df <- data.frame(
  k = ___,
  sil_width = ___
)

# Plot the relationship between k and sil_width
ggplot(___, aes(x = ___, y = ___)) +
  geom_line() +
  scale_x_continuous(breaks = 2:10)
Edit dan Jalankan Kode