Menghitung probabilitas
Pada latihan sebelumnya, Anda melihat bagaimana cara mengestimasi mean dan proporsi ketika probabilitas sudah diberikan. Tujuan latihan ini adalah mengestimasi probabilitas ketika mean dan proporsi sudah diketahui. Asumsikan mean untuk klaster 1 dan 2 masing-masing adalah 10 dan 50, serta asumsikan klaster 1 merepresentasikan 35 persen dari populasi.
Selain itu, karena kita hanya fokus pada estimasi parameter, asumsikan kedua sd bernilai 10. Himpunan data gaussian_sample tersedia di workspace Anda.
Latihan ini merupakan bagian dari kursus
Model Campuran di R
Instruksi latihan
- Buat data frame baru bernama
gaussian_sample_with_probsyang berisi estimasi probabilitas untuk klaster 1 dan 2. Untuk itu, buat dua variabel baru bernamaprob_cluster1danprob_cluster2. Ingat untuk menormalkan (menskalakan) probabilitasnya. - Tampilkan 6 observasi pertama dari
gaussian_sample_with_probs.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>%
___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
select(x, prob_cluster1, prob_cluster2)
head(___)