Campuran tiga distribusi Gaussian
Apa yang akan berubah jika kita memasukkan distribusi lain ke dalam simulasi? Anda akan melihat bahwa menambah jumlah komponen akan menyebarkan kepadatan massa untuk memasukkan distribusi tambahan, tetapi logikanya tetap mengikuti dari latihan sebelumnya.
Latihan ini adalah bagian dari kursus
Model Campuran di R
Petunjuk latihan
- Buat
assignments, yang mengambil nilai 0, 1, dan 2 dengan probabilitas masing-masing 0,3; 0,4; dan 0,3. - Data frame
mixturemengambil sampel dari distribusi Gaussian denganmean5 dansd2 ketikaassignmentsbernilai 1. Jikaassignmentsbernilai 2, makameanadalah 10 dansdadalah 1. Jika tidak, gunakan distribusi normal baku. - Plot histogram dengan 50 bin.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
number_observations <- 1000
# Create the assignment object
assignments <- sample(
c(0,1,2), size = number_observations, replace = TRUE, prob = c(0.3, ___, 0.3)
)
# Simulate the GMM with 3 distributions
mixture <- data.frame(
x = ifelse(___ == 1, rnorm(n = number_observations, mean = ___, sd = ___), ifelse(assignments == 2, rnorm(n = number_observations, mean = ___, sd = ___), rnorm(n = ___)))
)
# Plot the mixture
mixture %>%
ggplot() + ___(aes(x = x, y = ..density..), ___ = ___)