LoslegenKostenlos loslegen

Wahrscheinlichkeiten berechnen

In der letzten Übung hast du gesehen, wie du die Mittelwerte und Anteile schätzen kannst, wenn die Wahrscheinlichkeiten gegeben sind. In dieser Übung sollst du die Wahrscheinlichkeiten schätzen, wenn die Mittelwerte und Anteile bekannt sind. Gehe davon aus, dass die Mittelwerte für Cluster 1 und 2 jeweils 10 und 50 sind und dass Cluster 1 35 Prozent der Grundgesamtheit ausmacht.

Da wir uns nur für die Parameterschätzung interessieren, nimm außerdem an, dass beide sd gleich 10 sind. Der Datensatz gaussian_sample steht dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

Mischungsmodelle in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen neuen Data Frame namens gaussian_sample_with_probs mit den Schätzungen der Wahrscheinlichkeiten für Cluster 1 und 2. Lege dafür zwei neue Variablen an: prob_cluster1 und prob_cluster2. Denk daran, die Wahrscheinlichkeiten zu skalieren.
  • Sieh dir die ersten 6 Beobachtungen von gaussian_sample_with_probs an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>% 
  ___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
         prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
         prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
         prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
  select(x, prob_cluster1, prob_cluster2) 
         
head(___)
Code bearbeiten und ausführen