ComenzarEmpieza gratis

Comparar kmeans() y hclust()

Al comparar k-means y el clustering jerárquico, verás que ambos métodos generan pertenencias a clúster diferentes. Esto se debe a que los dos algoritmos hacen supuestos distintos sobre cómo se generan los datos. En un curso más avanzado, podríamos elegir un modelo u otro según la calidad de esos supuestos, pero por ahora basta con observar que son diferentes.

En este ejercicio vas a comparar los resultados de ambos modelos en el conjunto de datos pokemon para ver en qué difieren.

Este ejercicio forma parte del curso

Unsupervised Learning in R

Ver curso

Instrucciones del ejercicio

Los resultados de ejecutar k-means sobre los datos de pokemon (con 3 clústeres) están guardados en km.pokemon. El modelo de clustering jerárquico que creaste en el ejercicio anterior sigue disponible como hclust.pokemon.

  • Usando cutree() sobre hclust.pokemon, asigna a cada observación su pertenencia a clúster. Supón tres clústeres y guarda el resultado en un vector llamado cut.pokemon.
  • Usando table(), compara la pertenencia a clúster entre los dos métodos de clustering. Recuerda que los distintos componentes de los objetos de modelo de k-means se pueden acceder con el operador $.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Apply cutree() to hclust.pokemon: cut.pokemon


# Compare methods
table(___, ___)
Editar y ejecutar código