Análisis de silueta
El análisis de silueta te permite calcular lo similar que es cada observación al clúster al que está asignada en comparación con otros clústeres. Esta métrica (anchura de la silueta) varía entre -1 y 1 para cada observación de tus datos y se interpreta así:
- Valores cercanos a 1 sugieren que la observación encaja bien en el clúster asignado.
- Valores cercanos a 0 sugieren que la observación está en el límite entre dos clústeres.
- Valores cercanos a -1 sugieren que la observación puede estar asignada al clúster equivocado.
En este ejercicio usarás las funciones pam() y silhouette() de la librería cluster para realizar un análisis de silueta y comparar los resultados de modelos con k = 2 y k = 3. Continuarás trabajando con el conjunto de datos lineup.
Presta mucha atención al gráfico de silueta: ¿cada observación pertenece claramente a su clúster asignado para k = 3?
Este ejercicio forma parte del curso
Análisis de clústeres en R
Instrucciones del ejercicio
- Genera un modelo k-means
pam_k2usandopam()conk = 2sobre los datoslineup. - Representa el análisis de silueta con
plot(silhouette(model)). - Repite los dos primeros pasos para
k = 3, guardando el modelo comopam_k3. - Asegúrate de revisar las diferencias entre los gráficos antes de seguir (especialmente la observación 3) para
pam_k3.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
library(cluster)
# Generate a k-means model using the pam() function with a k = 2
pam_k2 <- pam(___, k = ___)
# Plot the silhouette visual for the pam_k2 model
plot(silhouette(___))
# Generate a k-means model using the pam() function with a k = 3
pam_k3 <- ___
# Plot the silhouette visual for the pam_k3 model