Estimativa dada as probabilidades
Estimar parâmetros em modelos de mistura não é uma tarefa trivial. Mas, se você tiver as probabilidades de pertencer a cada cluster, a estimativa das médias e das proporções dos clusters fica bem mais simples.
Neste exercício, você vai usar um conjunto de dados criado por duas distribuições Gaussianas, chamado gaussian_sample_with_probs, que na sua forma original tem apenas a coluna x, mas aqui você também recebe as probabilidades de cada cluster (prob_cluster1 e prob_cluster2). O objetivo é estimar os parâmetros e depois visualizar a mistura estimada.
Este exercício faz parte do curso
Modelos de Mistura em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Estimation of the means
___ <- ___ %>%
summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
mean_cluster2 = sum(x*___)/sum(___))
means_estimates
# Estimation of the proportions
props_estimates <- ___ %>%
summarise(props_cluster1 = ___(prob_cluster1),
props_cluster2 = 1 - ___)
props_estimates