Calcolare le probabilità
Nell'ultimo esercizio hai visto come stimare le medie e le proporzioni quando le probabilità sono fornite. L'obiettivo di questo esercizio è stimare le probabilità quando le medie e le proporzioni sono note. Supponi che le medie per i cluster 1 e 2 siano rispettivamente 10 e 50, e supponi che il cluster 1 rappresenti il 35 percento della popolazione.
Inoltre, poiché ci interessa solo la stima dei parametri, supponi che entrambe le sd siano 10. Il set di dati gaussian_sample è disponibile nel tuo workspace.
Questo esercizio fa parte del corso
Modelli di Mixture in R
Istruzioni dell'esercizio
- Crea un nuovo data frame chiamato
gaussian_sample_with_probscon le stime delle probabilità per i cluster 1 e 2. A questo scopo, crea due nuove variabili chiamateprob_cluster1eprob_cluster2. Ricorda di normalizzare (scalare) le probabilità. - Visualizza le prime 6 osservazioni di
gaussian_sample_with_probs.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>%
___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
select(x, prob_cluster1, prob_cluster2)
head(___)