Explorar las ramas cortadas del árbol
La función cutree() que usaste en los ejercicios 5 y 6 también puede cortar un árbol a una altura dada usando el parámetro h. Tómate un momento para explorar los clústeres que has generado en los ejercicios anteriores con alturas 20 y 40.
Este ejercicio forma parte del curso
Análisis de clústeres en R
Instrucciones del ejercicio
- Construye el vector de asignación de clúster
clusters_h20usandocutree()conh = 20. - Añade las asignaciones de clúster como una columna
clusteral data framelineupy guarda el resultado en un nuevo data frame llamadolineup_h20_complete. - Repite los dos pasos anteriores para una altura de 40, generando las variables
clusters_h40ylineup_h40_complete. - Usa ggplot2 para crear un diagrama de dispersión, coloreado por la asignación de clúster para ambas alturas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
dist_players <- dist(lineup, method = 'euclidean')
hc_players <- hclust(dist_players, method = "complete")
# Calculate the assignment vector with a h of 20
clusters_h20 <- ___
# Create a new data frame storing these results
lineup_h20_complete <- mutate(lineup, cluster = ___)
# Calculate the assignment vector with a h of 40
clusters_h40 <- ___
# Create a new data frame storing these results
lineup_h40_complete <- ___
# Plot the positions of the players and color them using their cluster for height = 20
ggplot(___, aes(x = ___, y = ___, color = factor(___))) +
geom_point()
# Plot the positions of the players and color them using their cluster for height = 40