Calculando as probabilidades
No último exercício, você viu como estimar as médias e as proporções quando as probabilidades são fornecidas. O objetivo deste exercício é estimar as probabilidades quando as médias e as proporções são conhecidas. Considere que as médias dos clusters 1 e 2 são 10 e 50, respectivamente, e que o cluster 1 representa 35 por cento da população.
Além disso, como estamos focados apenas na estimação dos parâmetros, considere que ambos os sd são 10. O conjunto de dados gaussian_sample está disponível no seu ambiente de trabalho.
Este exercício faz parte do curso
Modelos de Mistura em R
Instruções do exercício
- Crie um novo data frame chamado
gaussian_sample_with_probscom as estimativas das probabilidades para os clusters 1 e 2. Para isso, crie duas novas variáveis chamadasprob_cluster1eprob_cluster2. Lembre-se de escalar as probabilidades. - Confira as primeiras 6 observações de
gaussian_sample_with_probs.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>%
___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
select(x, prob_cluster1, prob_cluster2)
head(___)