Comparar kmeans() y hclust()
Al comparar k-means y el clustering jerárquico, verás que ambos métodos generan pertenencias a clúster diferentes. Esto se debe a que los dos algoritmos hacen supuestos distintos sobre cómo se generan los datos. En un curso más avanzado, podríamos elegir un modelo u otro según la calidad de esos supuestos, pero por ahora basta con observar que son diferentes.
En este ejercicio vas a comparar los resultados de ambos modelos en el conjunto de datos pokemon para ver en qué difieren.
Este ejercicio forma parte del curso
Unsupervised Learning in R
Instrucciones del ejercicio
Los resultados de ejecutar k-means sobre los datos de pokemon (con 3 clústeres) están guardados en km.pokemon. El modelo de clustering jerárquico que creaste en el ejercicio anterior sigue disponible como hclust.pokemon.
- Usando
cutree()sobrehclust.pokemon, asigna a cada observación su pertenencia a clúster. Supón tres clústeres y guarda el resultado en un vector llamadocut.pokemon. - Usando
table(), compara la pertenencia a clúster entre los dos métodos de clustering. Recuerda que los distintos componentes de los objetos de modelo de k-means se pueden acceder con el operador$.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Apply cutree() to hclust.pokemon: cut.pokemon
# Compare methods
table(___, ___)