Wahrscheinlichkeiten berechnen
In der letzten Übung hast du gesehen, wie du die Mittelwerte und Anteile schätzen kannst, wenn die Wahrscheinlichkeiten gegeben sind. In dieser Übung sollst du die Wahrscheinlichkeiten schätzen, wenn die Mittelwerte und Anteile bekannt sind. Gehe davon aus, dass die Mittelwerte für Cluster 1 und 2 jeweils 10 und 50 sind und dass Cluster 1 35 Prozent der Grundgesamtheit ausmacht.
Da wir uns nur für die Parameterschätzung interessieren, nimm außerdem an, dass beide sd gleich 10 sind. Der Datensatz gaussian_sample steht dir in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Mischungsmodelle in R
Anleitung zur Übung
- Erstelle einen neuen Data Frame namens
gaussian_sample_with_probsmit den Schätzungen der Wahrscheinlichkeiten für Cluster 1 und 2. Lege dafür zwei neue Variablen an:prob_cluster1undprob_cluster2. Denk daran, die Wahrscheinlichkeiten zu skalieren. - Sieh dir die ersten 6 Beobachtungen von
gaussian_sample_with_probsan.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>%
___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
select(x, prob_cluster1, prob_cluster2)
head(___)