Schätzung bei gegebenen Wahrscheinlichkeiten
Die Parameterschätzung für Mischmodelle ist keine leichte Aufgabe. Wenn dir jedoch die Wahrscheinlichkeiten für die Zugehörigkeit zu jedem Cluster vorliegen, sind die Schätzungen der Mittelwerte und der Anteile der Cluster nicht so schwierig.
In dieser Übung verwendest du einen Datensatz, der aus zwei Gaußschen Verteilungen erzeugt wurde, gaussian_sample_with_probs. In seiner Originalform enthält er nur die Spalte x, hier bekommst du zusätzlich die Zugehörigkeitswahrscheinlichkeiten für jedes Cluster (prob_cluster1 und prob_cluster2). Ziel ist es, die Parameter zu schätzen und anschließend die geschätzte Mischung zu visualisieren.
Diese Übung ist Teil des Kurses
Mischungsmodelle in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Estimation of the means
___ <- ___ %>%
summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
mean_cluster2 = sum(x*___)/sum(___))
means_estimates
# Estimation of the proportions
props_estimates <- ___ %>%
summarise(props_cluster1 = ___(prob_cluster1),
props_cluster2 = 1 - ___)
props_estimates