ComeçarComece de graça

Estimativa dada as probabilidades

Estimar parâmetros em modelos de mistura não é uma tarefa trivial. Mas, se você tiver as probabilidades de pertencer a cada cluster, a estimativa das médias e das proporções dos clusters fica bem mais simples.

Neste exercício, você vai usar um conjunto de dados criado por duas distribuições Gaussianas, chamado gaussian_sample_with_probs, que na sua forma original tem apenas a coluna x, mas aqui você também recebe as probabilidades de cada cluster (prob_cluster1 e prob_cluster2). O objetivo é estimar os parâmetros e depois visualizar a mistura estimada.

Este exercício faz parte do curso

Modelos de Mistura em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Estimation of the means
___ <- ___ %>% 
  summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
            mean_cluster2 = sum(x*___)/sum(___))
means_estimates

# Estimation of the proportions
props_estimates <- ___ %>% 
  summarise(props_cluster1 = ___(prob_cluster1),
            props_cluster2 = 1 - ___)
props_estimates
Editar e executar o código