ComeçarComece de graça

Comparando kmeans() e hclust()

Comparando k-means e o agrupamento hierárquico, você verá que os dois métodos produzem participações em clusters diferentes. Isso acontece porque os dois algoritmos partem de suposições distintas sobre como os dados são gerados. Em um curso mais avançado, poderíamos escolher um modelo em vez de outro com base na qualidade dessas suposições, mas por ora, basta observar que eles são diferentes.

Neste exercício, você vai comparar os resultados dos dois modelos no conjunto de dados pokemon para ver como eles diferem.

Este exercício faz parte do curso

Aprendizado não supervisionado em R

Ver curso

Instruções do exercício

Os resultados do k-means aplicado aos dados de pokemon (com 3 clusters) estão armazenados em km.pokemon. O modelo de agrupamento hierárquico que você criou no exercício anterior ainda está disponível como hclust.pokemon.

  • Usando cutree() em hclust.pokemon, atribua a participação em clusters para cada observação. Considere três clusters e atribua o resultado a um vetor chamado cut.pokemon.
  • Usando table(), compare a participação em clusters entre os dois métodos de agrupamento. Lembre-se de que os diferentes componentes de objetos de modelo de k-means podem ser acessados com o operador $.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Apply cutree() to hclust.pokemon: cut.pokemon


# Compare methods
table(___, ___)
Editar e executar o código