ComenzarEmpieza gratis

Gráfico del codo (Scree)

En los ejercicios anteriores has calculado la suma total de cuadrados intracluster para valores de k de 1 a 10. Puedes visualizar esta relación con un gráfico de líneas para crear lo que se conoce como un gráfico del codo (o scree plot).

Al observar un gráfico del codo, quieres ver una caída brusca de un valor de k a otro, seguida de una disminución más gradual de la pendiente. El último valor de k antes de que la pendiente del gráfico se estabilice suele indicar un valor "bueno" de k.

Este ejercicio forma parte del curso

Análisis de clústeres en R

Ver curso

Instrucciones del ejercicio

  • Siguiendo con tu trabajo del ejercicio anterior, usa los valores de elbow_df para dibujar un gráfico de líneas que muestre la relación entre k y la suma total de cuadrados intracluster.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Use map_dbl to run many models with varying value of k (centers)
tot_withinss <- map_dbl(1:10,  function(k){
  model <- kmeans(x = lineup, centers = k)
  model$tot.withinss
})

# Generate a data frame containing both k and tot_withinss
elbow_df <- data.frame(
  k = 1:10,
  tot_withinss = tot_withinss
)

# Plot the elbow plot
ggplot(___, aes(x = ___, y = ___)) +
  geom_line() +
  scale_x_continuous(breaks = 1:10)
Editar y ejecutar código