Schatting gegeven de waarschijnlijkheden
Parameters schatten voor mixture models is niet eenvoudig. Maar als je de waarschijnlijkheden hebt voor het behoren tot elk cluster, zijn de schattingen van de gemiddelden en de verhoudingen van de clusters een stuk makkelijker.
In deze oefening gebruik je een gegevensset die is gemaakt met twee Gaussiaanse verdelingen, gaussian_sample_with_probs. In de oorspronkelijke vorm heeft die alleen de kolom x, maar hier krijg je ook de waarschijnlijkheden voor elk cluster (prob_cluster1 en prob_cluster2). Het doel is om de parameters te schatten en vervolgens de geschatte mix te visualiseren.
Deze oefening maakt deel uit van de cursus
Mixture Models in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Estimation of the means
___ <- ___ %>%
summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
mean_cluster2 = sum(x*___)/sum(___))
means_estimates
# Estimation of the proportions
props_estimates <- ___ %>%
summarise(props_cluster1 = ___(prob_cluster1),
props_cluster2 = 1 - ___)
props_estimates