ComeçarComece de graça

Visualizar os clusters

Até aqui, temos tudo o que precisamos para plotar as observações junto com as elipses que representam os clusters.

Além disso, se quisermos atribuir cada observação a um dos dois clusters, podemos usar a função clusters() e comparar os resultados com os rótulos reais. Só para lembrar: quando usamos apenas a variável Weight para agrupar os dados, previmos corretamente 4500 mulheres e 4556 homens. Vamos ver se conseguimos separar melhor os clusters ao incorporar uma variável adicional.

Este exercício faz parte do curso

Modelos de Mistura em R

Ver curso

Instruções do exercício

  • Use geom_point() para fazer o gráfico de dispersão de Weight e BMI. Adicione a esse gráfico as duas elipses salvas em ellipses_comp_number com a função geom_path().
  • Atenção: as elipses devem ser transformadas em um data frame.
  • Pinte o cluster 1 de vermelho e o cluster 2 de azul.
  • Estime a tabela de frequências dos rótulos reais armazenados na variável Gender versus os rótulos previstos estimados por clusters.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Plot the ellipses
gender %>% 
  ggplot(aes(x = ___, y = ___)) + ___()+
  geom_path(data = data.frame(ellipse_comp_1), aes(x=x,y=y), col = "___") +
  geom_path(data = data.frame(ellipse_comp_2), aes(x=x,y=y), col = "___")
# Check the assignments
table(gender$Gender, clusters(fit_with_cov))
Editar e executar o código