Aan de slagGa gratis aan de slag

Schatting gegeven de waarschijnlijkheden

Parameters schatten voor mixture models is niet eenvoudig. Maar als je de waarschijnlijkheden hebt voor het behoren tot elk cluster, zijn de schattingen van de gemiddelden en de verhoudingen van de clusters een stuk makkelijker.

In deze oefening gebruik je een gegevensset die is gemaakt met twee Gaussiaanse verdelingen, gaussian_sample_with_probs. In de oorspronkelijke vorm heeft die alleen de kolom x, maar hier krijg je ook de waarschijnlijkheden voor elk cluster (prob_cluster1 en prob_cluster2). Het doel is om de parameters te schatten en vervolgens de geschatte mix te visualiseren.

Deze oefening maakt deel uit van de cursus

Mixture Models in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Estimation of the means
___ <- ___ %>% 
  summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
            mean_cluster2 = sum(x*___)/sum(___))
means_estimates

# Estimation of the proportions
props_estimates <- ___ %>% 
  summarise(props_cluster1 = ___(prob_cluster1),
            props_cluster2 = 1 - ___)
props_estimates
Code bewerken en uitvoeren