Visualizar os clusters
Até aqui, temos tudo o que precisamos para plotar as observações junto com as elipses que representam os clusters.
Além disso, se quisermos atribuir cada observação a um dos dois clusters, podemos usar a função clusters() e comparar os resultados com os rótulos reais. Só para lembrar: quando usamos apenas a variável Weight para agrupar os dados, previmos corretamente 4500 mulheres e 4556 homens. Vamos ver se conseguimos separar melhor os clusters ao incorporar uma variável adicional.
Este exercício faz parte do curso
Modelos de Mistura em R
Instruções do exercício
- Use
geom_point()para fazer o gráfico de dispersão deWeighteBMI. Adicione a esse gráfico as duas elipses salvas emellipses_comp_numbercom a funçãogeom_path(). - Atenção: as elipses devem ser transformadas em um data frame.
- Pinte o cluster 1 de vermelho e o cluster 2 de azul.
- Estime a tabela de frequências dos rótulos reais armazenados na variável
Genderversus os rótulos previstos estimados porclusters.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the ellipses
gender %>%
ggplot(aes(x = ___, y = ___)) + ___()+
geom_path(data = data.frame(ellipse_comp_1), aes(x=x,y=y), col = "___") +
geom_path(data = data.frame(ellipse_comp_2), aes(x=x,y=y), col = "___")
# Check the assignments
table(gender$Gender, clusters(fit_with_cov))