Mix van drie Gaussiaanse verdelingen
Wat verandert er als we nog een verdeling opnemen in onze simulatie? Je zult zien dat het vergroten van het aantal componenten de massadichtheid spreidt om de extra verdeling mee te nemen, maar de logica volgt nog steeds uit de vorige oefening.
Deze oefening maakt deel uit van de cursus
Mixture Models in R
Oefeninstructies
- Maak
assignments, dat de waarden 0, 1 en 2 aanneemt met respectievelijke kansen van 0,3, 0,4 en 0,3. - De data frame
mixturesampelt uit een Gaussiaan met eenmeanvan 5 ensdvan 2 wanneerassignmentsgelijk is aan 1. Alsassignmentsgelijk is aan 2, is demean10 en desd1. Anders is het een standaardnormale verdeling. - Plot het histogram met 50 bins.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
number_observations <- 1000
# Create the assignment object
assignments <- sample(
c(0,1,2), size = number_observations, replace = TRUE, prob = c(0.3, ___, 0.3)
)
# Simulate the GMM with 3 distributions
mixture <- data.frame(
x = ifelse(___ == 1, rnorm(n = number_observations, mean = ___, sd = ___), ifelse(assignments == 2, rnorm(n = number_observations, mean = ___, sd = ___), rnorm(n = ___)))
)
# Plot the mixture
mixture %>%
ggplot() + ___(aes(x = x, y = ..density..), ___ = ___)