Estimación dada las probabilidades
La estimación de parámetros en modelos de mezcla no es una tarea sencilla. Pero si cuentas con las probabilidades de pertenencia a cada clúster, estimar las medias y las proporciones de los clústeres no resulta tan difícil.
En este ejercicio, utilizarás un conjunto de datos generado a partir de dos distribuciones gaussianas llamado gaussian_sample_with_probs, que en su forma original solo tiene la columna x, pero aquí también se te proporcionan las probabilidades de cada clúster (prob_cluster1 y prob_cluster2). El objetivo es estimar los parámetros y luego visualizar la mezcla estimada.
Este ejercicio forma parte del curso
Modelos de mezcla en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Estimation of the means
___ <- ___ %>%
summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
mean_cluster2 = sum(x*___)/sum(___))
means_estimates
# Estimation of the proportions
props_estimates <- ___ %>%
summarise(props_cluster1 = ___(prob_cluster1),
props_cluster2 = 1 - ___)
props_estimates