ComeçarComece de graça

Calculando as probabilidades

No último exercício, você viu como estimar as médias e as proporções quando as probabilidades são fornecidas. O objetivo deste exercício é estimar as probabilidades quando as médias e as proporções são conhecidas. Considere que as médias dos clusters 1 e 2 são 10 e 50, respectivamente, e que o cluster 1 representa 35 por cento da população.

Além disso, como estamos focados apenas na estimação dos parâmetros, considere que ambos os sd são 10. O conjunto de dados gaussian_sample está disponível no seu ambiente de trabalho.

Este exercício faz parte do curso

Modelos de Mistura em R

Ver curso

Instruções do exercício

  • Crie um novo data frame chamado gaussian_sample_with_probs com as estimativas das probabilidades para os clusters 1 e 2. Para isso, crie duas novas variáveis chamadas prob_cluster1 e prob_cluster2. Lembre-se de escalar as probabilidades.
  • Confira as primeiras 6 observações de gaussian_sample_with_probs.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>% 
  ___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
         prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
         prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
         prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
  select(x, prob_cluster1, prob_cluster2) 
         
head(___)
Editar e executar o código