ComenzarEmpieza gratis

Análisis de silueta

El análisis de silueta te permite calcular lo similar que es cada observación al clúster al que está asignada en comparación con otros clústeres. Esta métrica (anchura de la silueta) varía entre -1 y 1 para cada observación de tus datos y se interpreta así:

  • Valores cercanos a 1 sugieren que la observación encaja bien en el clúster asignado.
  • Valores cercanos a 0 sugieren que la observación está en el límite entre dos clústeres.
  • Valores cercanos a -1 sugieren que la observación puede estar asignada al clúster equivocado.

En este ejercicio usarás las funciones pam() y silhouette() de la librería cluster para realizar un análisis de silueta y comparar los resultados de modelos con k = 2 y k = 3. Continuarás trabajando con el conjunto de datos lineup.

Presta mucha atención al gráfico de silueta: ¿cada observación pertenece claramente a su clúster asignado para k = 3?

Este ejercicio forma parte del curso

Análisis de clústeres en R

Ver curso

Instrucciones del ejercicio

  • Genera un modelo k-means pam_k2 usando pam() con k = 2 sobre los datos lineup.
  • Representa el análisis de silueta con plot(silhouette(model)).
  • Repite los dos primeros pasos para k = 3, guardando el modelo como pam_k3.
  • Asegúrate de revisar las diferencias entre los gráficos antes de seguir (especialmente la observación 3) para pam_k3.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

library(cluster)

# Generate a k-means model using the pam() function with a k = 2
pam_k2 <- pam(___, k = ___)

# Plot the silhouette visual for the pam_k2 model
plot(silhouette(___))

# Generate a k-means model using the pam() function with a k = 3
pam_k3 <- ___

# Plot the silhouette visual for the pam_k3 model

Editar y ejecutar código