Aan de slagGa gratis aan de slag

De kansen berekenen

In de vorige oefening zag je hoe je de gemiddelden en proporties kunt schatten wanneer de kansen gegeven zijn. In deze oefening ga je de kansen schatten wanneer de gemiddelden en de proporties bekend zijn. Neem aan dat de gemiddelden voor cluster 1 en 2 respectievelijk 10 en 50 zijn, en dat cluster 1 35 procent van de populatie vertegenwoordigt.

Omdat we ons alleen bezighouden met het schatten van de parameters, neem ook aan dat beide sd gelijk zijn aan 10. De gegevensset gaussian_sample staat voor je klaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Mixture Models in R

Cursus bekijken

Oefeninstructies

  • Maak een nieuwe data frame gaussian_sample_with_probs met de schattingen van de kansen voor cluster 1 en 2. Maak daarvoor twee nieuwe variabelen aan: prob_cluster1 en prob_cluster2. Vergeet niet de kansen te schalen.
  • Bekijk de eerste 6 observaties van gaussian_sample_with_probs.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>% 
  ___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
         prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
         prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
         prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
  select(x, prob_cluster1, prob_cluster2) 
         
head(___)
Code bewerken en uitvoeren