Stima date le probabilità
La stima dei parametri per i modelli di miscela non è un compito semplice. Però, se hai a disposizione le probabilità di appartenenza a ciascun cluster, stimare le medie e le proporzioni dei cluster non è così difficile.
In questo esercizio userai un insieme di dati generato da due distribuzioni gaussiane, chiamato gaussian_sample_with_probs, che nella sua forma originale contiene solo la colonna x, ma qui include anche le probabilità per ciascun cluster (prob_cluster1 e prob_cluster2). L’obiettivo è stimare i parametri e poi visualizzare la miscela stimata.
Questo esercizio fa parte del corso
Modelli di Mixture in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Estimation of the means
___ <- ___ %>%
summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
mean_cluster2 = sum(x*___)/sum(___))
means_estimates
# Estimation of the proportions
props_estimates <- ___ %>%
summarise(props_cluster1 = ___(prob_cluster1),
props_cluster2 = 1 - ___)
props_estimates