ComeçarComece de graça

Agrupamento k-means e comparando resultados

Como você já sabe, há dois tipos principais de agrupamento: hierárquico e k-means.

Neste exercício, você vai criar um modelo de agrupamento k-means com os dados de câncer de mama de Wisconsin e comparar os resultados com os diagnósticos reais e com os resultados do seu modelo de agrupamento hierárquico. Reserve um tempo para avaliar como cada modelo de agrupamento se sai ao separar os dois diagnósticos e como os modelos se comparam entre si.

Este exercício faz parte do curso

Aprendizado não supervisionado em R

Ver curso

Instruções do exercício

wisc.data, diagnosis e wisc.hclust.clusters ainda estão disponíveis.

  • Crie um modelo k-means em wisc.data, atribuindo o resultado a wisc.km. Certifique-se de criar 2 clusters, correspondentes ao número real de diagnósticos. Além disso, lembre-se de padronizar os dados e repetir o algoritmo 20 vezes para encontrar um modelo com bom desempenho.
  • Use a função table() para comparar a associação de clusters do modelo k-means com os diagnósticos reais contidos no vetor diagnosis. Como o k-means separa os dois diagnósticos?
  • Use a função table() para comparar a associação de clusters do modelo k-means com o modelo de agrupamento hierárquico. Lembre-se de que a associação de clusters do modelo hierárquico está em wisc.hclust.clusters.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a k-means model on wisc.data: wisc.km


# Compare k-means to actual diagnoses


# Compare k-means to hierarchical clustering
Editar e executar o código