De kansen berekenen
In de vorige oefening zag je hoe je de gemiddelden en proporties kunt schatten wanneer de kansen gegeven zijn. In deze oefening ga je de kansen schatten wanneer de gemiddelden en de proporties bekend zijn. Neem aan dat de gemiddelden voor cluster 1 en 2 respectievelijk 10 en 50 zijn, en dat cluster 1 35 procent van de populatie vertegenwoordigt.
Omdat we ons alleen bezighouden met het schatten van de parameters, neem ook aan dat beide sd gelijk zijn aan 10. De gegevensset gaussian_sample staat voor je klaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Mixture Models in R
Oefeninstructies
- Maak een nieuwe data frame
gaussian_sample_with_probsmet de schattingen van de kansen voor cluster 1 en 2. Maak daarvoor twee nieuwe variabelen aan:prob_cluster1enprob_cluster2. Vergeet niet de kansen te schalen. - Bekijk de eerste 6 observaties van
gaussian_sample_with_probs.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>%
___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
select(x, prob_cluster1, prob_cluster2)
head(___)