ComenzarEmpieza gratis

K-means: anchuras promedio de silueta

Así que la agrupación jerárquica da 3 clústeres y el método del codo sugiere 2. En este ejercicio, usa las anchuras promedio de silueta para explorar cuál debería ser el valor "óptimo" de k.

Este ejercicio forma parte del curso

Análisis de clústeres en R

Ver curso

Instrucciones del ejercicio

  • Usa map_dbl() para ejecutar pam() con los datos oes para valores de k de 2 a 10 y extrae el valor de anchura promedio de silueta de cada modelo: model$silinfo$avg.width. Guarda el vector resultante como sil_width.
  • Crea un nuevo data frame sil_df que contenga los valores de k y el vector de anchuras promedio de silueta.
  • Usa los valores de sil_df para trazar un gráfico de líneas que muestre la relación entre k y la anchura promedio de silueta.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Use map_dbl to run many models with varying value of k
sil_width <- map_dbl(2:10,  function(k){
  model <- pam(___, k = ___)
  model$silinfo$avg.width
})

# Generate a data frame containing both k and sil_width
sil_df <- data.frame(
  k = ___,
  sil_width = ___
)

# Plot the relationship between k and sil_width
ggplot(___, aes(x = ___, y = ___)) +
  geom_line() +
  scale_x_continuous(breaks = 2:10)
Editar y ejecutar código