Comparando kmeans() e hclust()
Comparando k-means e o agrupamento hierárquico, você verá que os dois métodos produzem participações em clusters diferentes. Isso acontece porque os dois algoritmos partem de suposições distintas sobre como os dados são gerados. Em um curso mais avançado, poderíamos escolher um modelo em vez de outro com base na qualidade dessas suposições, mas por ora, basta observar que eles são diferentes.
Neste exercício, você vai comparar os resultados dos dois modelos no conjunto de dados pokemon para ver como eles diferem.
Este exercício faz parte do curso
Aprendizado não supervisionado em R
Instruções do exercício
Os resultados do k-means aplicado aos dados de pokemon (com 3 clusters) estão armazenados em km.pokemon. O modelo de agrupamento hierárquico que você criou no exercício anterior ainda está disponível como hclust.pokemon.
- Usando
cutree()emhclust.pokemon, atribua a participação em clusters para cada observação. Considere três clusters e atribua o resultado a um vetor chamadocut.pokemon. - Usando
table(), compare a participação em clusters entre os dois métodos de agrupamento. Lembre-se de que os diferentes componentes de objetos de modelo de k-means podem ser acessados com o operador$.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Apply cutree() to hclust.pokemon: cut.pokemon
# Compare methods
table(___, ___)