ComenzarEmpieza gratis

Estimación dada las probabilidades

La estimación de parámetros en modelos de mezcla no es una tarea sencilla. Pero si cuentas con las probabilidades de pertenencia a cada clúster, estimar las medias y las proporciones de los clústeres no resulta tan difícil.

En este ejercicio, utilizarás un conjunto de datos generado a partir de dos distribuciones gaussianas llamado gaussian_sample_with_probs, que en su forma original solo tiene la columna x, pero aquí también se te proporcionan las probabilidades de cada clúster (prob_cluster1 y prob_cluster2). El objetivo es estimar los parámetros y luego visualizar la mezcla estimada.

Este ejercicio forma parte del curso

Modelos de mezcla en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Estimation of the means
___ <- ___ %>% 
  summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
            mean_cluster2 = sum(x*___)/sum(___))
means_estimates

# Estimation of the proportions
props_estimates <- ___ %>% 
  summarise(props_cluster1 = ___(prob_cluster1),
            props_cluster2 = 1 - ___)
props_estimates
Editar y ejecutar código