LoslegenKostenlos starten

Wahrscheinlichkeiten berechnen

In der letzten Übung hast du gesehen, wie du die Mittelwerte und Anteile schätzen kannst, wenn die Wahrscheinlichkeiten gegeben sind. In dieser Übung sollst du die Wahrscheinlichkeiten schätzen, wenn die Mittelwerte und Anteile bekannt sind. Gehe davon aus, dass die Mittelwerte für Cluster 1 und 2 jeweils 10 und 50 sind und dass Cluster 1 35 Prozent der Grundgesamtheit ausmacht.

Da wir uns nur für die Parameterschätzung interessieren, nimm außerdem an, dass beide sd gleich 10 sind. Der Datensatz gaussian_sample steht dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Mischungsmodelle in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle einen neuen Data Frame namens gaussian_sample_with_probs mit den Schätzungen der Wahrscheinlichkeiten für Cluster 1 und 2. Lege dafür zwei neue Variablen an: prob_cluster1 und prob_cluster2. Denk daran, die Wahrscheinlichkeiten zu skalieren.
  • Sieh dir die ersten 6 Beobachtungen von gaussian_sample_with_probs an.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create data frame with probabilities
gaussian_sample_with_probs <- gaussian_sample %>% 
  ___(prob_from_cluster1 = 0.35 * ___(___, mean = 10, sd = 10),
         prob_from_cluster2 = 0.65 * dnorm(___, mean = 50, sd = 10),
         prob_cluster1 = ___/(prob_from_cluster1 + prob_from_cluster2),
         prob_cluster2 = ___/(prob_from_cluster1 + prob_from_cluster2)) %>%
  select(x, prob_cluster1, prob_cluster2) 
         
head(___)
Code bearbeiten und ausführen