Agrupamento k-means e comparando resultados
Como você já sabe, há dois tipos principais de agrupamento: hierárquico e k-means.
Neste exercício, você vai criar um modelo de agrupamento k-means com os dados de câncer de mama de Wisconsin e comparar os resultados com os diagnósticos reais e com os resultados do seu modelo de agrupamento hierárquico. Reserve um tempo para avaliar como cada modelo de agrupamento se sai ao separar os dois diagnósticos e como os modelos se comparam entre si.
Este exercício faz parte do curso
Aprendizado não supervisionado em R
Instruções do exercício
wisc.data, diagnosis e wisc.hclust.clusters ainda estão disponíveis.
- Crie um modelo k-means em
wisc.data, atribuindo o resultado awisc.km. Certifique-se de criar 2 clusters, correspondentes ao número real de diagnósticos. Além disso, lembre-se de padronizar os dados e repetir o algoritmo 20 vezes para encontrar um modelo com bom desempenho. - Use a função
table()para comparar a associação de clusters do modelo k-means com os diagnósticos reais contidos no vetordiagnosis. Como o k-means separa os dois diagnósticos? - Use a função
table()para comparar a associação de clusters do modelo k-means com o modelo de agrupamento hierárquico. Lembre-se de que a associação de clusters do modelo hierárquico está emwisc.hclust.clusters.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a k-means model on wisc.data: wisc.km
# Compare k-means to actual diagnoses
# Compare k-means to hierarchical clustering