LoslegenKostenlos starten

Schätzung bei gegebenen Wahrscheinlichkeiten

Die Parameterschätzung für Mischmodelle ist keine leichte Aufgabe. Wenn dir jedoch die Wahrscheinlichkeiten für die Zugehörigkeit zu jedem Cluster vorliegen, sind die Schätzungen der Mittelwerte und der Anteile der Cluster nicht so schwierig.

In dieser Übung verwendest du einen Datensatz, der aus zwei Gaußschen Verteilungen erzeugt wurde, gaussian_sample_with_probs. In seiner Originalform enthält er nur die Spalte x, hier bekommst du zusätzlich die Zugehörigkeitswahrscheinlichkeiten für jedes Cluster (prob_cluster1 und prob_cluster2). Ziel ist es, die Parameter zu schätzen und anschließend die geschätzte Mischung zu visualisieren.

Diese Übung ist Teil des Kurses

<Kurs>Mischungsmodelle in R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Estimation of the means
___ <- ___ %>% 
  summarise(mean_cluster1= sum(___*prob_cluster1)/sum(prob_cluster1),
            mean_cluster2 = sum(x*___)/sum(___))
means_estimates

# Estimation of the proportions
props_estimates <- ___ %>% 
  summarise(props_cluster1 = ___(prob_cluster1),
            props_cluster2 = 1 - ___)
props_estimates
Code bearbeiten und ausführen