Menghitung probabilitas
Pada latihan sebelumnya, Anda melihat bagaimana cara mengestimasi mean dan proporsi ketika probabilitas sudah diberikan. Tujuan latihan ini adalah mengestimasi probabilitas ketika mean dan proporsi sudah diketahui. Asumsikan mean untuk klaster 1 dan 2 masing-masing adalah 10 dan 50, serta asumsikan klaster 1 merepresentasikan 35 persen dari populasi.
Selain itu, karena kita hanya fokus pada estimasi parameter, asumsikan kedua sd bernilai 10. Himpunan data gaussian_sample tersedia di workspace Anda.
Latihan ini adalah bagian dari kursus
Model Campuran di R
Petunjuk latihan
- Buat data frame baru bernama
gaussian_sample_with_probsyang berisi estimasi probabilitas untuk klaster 1 dan 2. Untuk itu, buat dua variabel baru bernamaprob_cluster1danprob_cluster2. Ingat untuk menormalkan (menskalakan) probabilitasnya. - Tampilkan 6 observasi pertama dari
gaussian_sample_with_probs.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>%
___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
select(x, prob_cluster1, prob_cluster2)
head(___)