ComenzarEmpieza gratis

Calcular las probabilidades

En el último ejercicio viste cómo estimar las medias y las proporciones cuando las probabilidades están dadas. El objetivo de este ejercicio es estimar las probabilidades cuando las medias y las proporciones son conocidas. Supón que las medias de los clústeres 1 y 2 son 10 y 50, respectivamente, y que el clúster 1 representa el 35 por ciento de la población.

Además, como aquí solo nos interesan las estimaciones de los parámetros, asume que ambas sd son 10. El conjunto de datos gaussian_sample está disponible en tu espacio de trabajo.

Este ejercicio forma parte del curso

Modelos de mezcla en R

Ver curso

Instrucciones del ejercicio

  • Crea un nuevo data frame llamado gaussian_sample_with_probs con las estimaciones de las probabilidades para los clústeres 1 y 2. Para ello, crea dos variables nuevas llamadas prob_cluster1 y prob_cluster2. Recuerda escalar las probabilidades.
  • Consulta las primeras 6 observaciones de gaussian_sample_with_probs.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>% 
  ___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
         prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
         prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
         prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
  select(x, prob_cluster1, prob_cluster2) 
         
head(___)
Editar y ejecutar código