Aan de slagGa gratis aan de slag

Mix van drie Gaussiaanse verdelingen

Wat verandert er als we nog een verdeling opnemen in onze simulatie? Je zult zien dat het vergroten van het aantal componenten de massadichtheid spreidt om de extra verdeling mee te nemen, maar de logica volgt nog steeds uit de vorige oefening.

Deze oefening maakt deel uit van de cursus

Mixture Models in R

Cursus bekijken

Oefeninstructies

  • Maak assignments, dat de waarden 0, 1 en 2 aanneemt met respectievelijke kansen van 0,3, 0,4 en 0,3.
  • De data frame mixture sampelt uit een Gaussiaan met een mean van 5 en sd van 2 wanneer assignments gelijk is aan 1. Als assignments gelijk is aan 2, is de mean 10 en de sd 1. Anders is het een standaardnormale verdeling.
  • Plot het histogram met 50 bins.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

number_observations <- 1000

# Create the assignment object
assignments <- sample(
	c(0,1,2), size = number_observations, replace = TRUE, prob = c(0.3, ___, 0.3)
)

# Simulate the GMM with 3 distributions
mixture <- data.frame(
	x = ifelse(___ == 1, rnorm(n = number_observations, mean = ___, sd = ___), ifelse(assignments == 2, rnorm(n = number_observations, mean = ___, sd = ___), rnorm(n = ___)))
)

# Plot the mixture
mixture %>% 
  ggplot() + ___(aes(x = x, y = ..density..), ___ = ___)
Code bewerken en uitvoeren