K-means: anchuras promedio de silueta
Así que la agrupación jerárquica da 3 clústeres y el método del codo sugiere 2. En este ejercicio, usa las anchuras promedio de silueta para explorar cuál debería ser el valor "óptimo" de k.
Este ejercicio forma parte del curso
Análisis de clústeres en R
Instrucciones del ejercicio
- Usa
map_dbl()para ejecutarpam()con los datosoespara valores de k de 2 a 10 y extrae el valor de anchura promedio de silueta de cada modelo:model$silinfo$avg.width. Guarda el vector resultante comosil_width. - Crea un nuevo data frame
sil_dfque contenga los valores de k y el vector de anchuras promedio de silueta. - Usa los valores de
sil_dfpara trazar un gráfico de líneas que muestre la relación entre k y la anchura promedio de silueta.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Use map_dbl to run many models with varying value of k
sil_width <- map_dbl(2:10, function(k){
model <- pam(___, k = ___)
model$silinfo$avg.width
})
# Generate a data frame containing both k and sil_width
sil_df <- data.frame(
k = ___,
sil_width = ___
)
# Plot the relationship between k and sil_width
ggplot(___, aes(x = ___, y = ___)) +
geom_line() +
scale_x_continuous(breaks = 2:10)