Calcular las probabilidades
En el último ejercicio viste cómo estimar las medias y las proporciones cuando las probabilidades están dadas. El objetivo de este ejercicio es estimar las probabilidades cuando las medias y las proporciones son conocidas. Supón que las medias de los clústeres 1 y 2 son 10 y 50, respectivamente, y que el clúster 1 representa el 35 por ciento de la población.
Además, como aquí solo nos interesan las estimaciones de los parámetros, asume que ambas sd son 10. El conjunto de datos gaussian_sample está disponible en tu espacio de trabajo.
Este ejercicio forma parte del curso
Modelos de mezcla en R
Instrucciones del ejercicio
- Crea un nuevo data frame llamado
gaussian_sample_with_probscon las estimaciones de las probabilidades para los clústeres 1 y 2. Para ello, crea dos variables nuevas llamadasprob_cluster1yprob_cluster2. Recuerda escalar las probabilidades. - Consulta las primeras 6 observaciones de
gaussian_sample_with_probs.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>%
___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
select(x, prob_cluster1, prob_cluster2)
head(___)