LoslegenKostenlos loslegen

Resampling aus einer Stichprobe

Um zu untersuchen, wie stark sich Schätzungen eines Anteils in der Grundgesamtheit von Stichprobe zu Stichprobe ändern, richtest du zwei Stichproben-Experimente ein.

Im ersten Experiment simulierst du wiederholte Stichproben aus einer Grundgesamtheit. Im zweiten wählst du eine einzelne Stichprobe aus dem ersten Experiment und ziehst daraus wiederholt neue Stichproben (mit Zurücklegen): Diese Methode heißt Bootstrapping. Genauer:

Experiment 1: Nimm an, der wahre Anteil der Personen, die Kandidat X wählen werden, beträgt 0,6. Ziehe wiederholt 30 Personen aus der Grundgesamtheit und miss die Variabilität von \(\hat{p}\) (dem Stichproben-Anteil).

Experiment 2: Ziehe eine Stichprobe der Größe 30 aus derselben Grundgesamtheit. Ziehe daraus wiederholt 30 Personen (mit Zurücklegen!) aus der ursprünglichen Stichprobe und miss die Variabilität von \(\hat{p}^*\) (dem Resample-Anteil).

Wichtig ist: Das erste Experiment setzt voraus, dass die Grundgesamtheit bekannt ist, und ist in der Praxis meist unmöglich. Das zweite basiert nur auf der Stichprobe und lässt sich daher für jede Statistik leicht umsetzen. Zum Glück ist, wie du sehen wirst, die Variabilität von \(\hat{p}\) – also dem Anteil der „Erfolge“ in einer Stichprobe – in etwa gleich, egal ob wir aus der Grundgesamtheit ziehen oder aus einer Stichprobe resamplen.

Wir haben 1000 Zufallsstichproben mit jeweils 30 Beobachtungen aus der Grundgesamtheit erstellt. Das resultierende Data Frame all_polls steht dir in deinem Workspace zur Verfügung. Schau es dir an, bevor du loslegst.

Diese Übung ist Teil des Kurses

Grundlagen der Inferenz in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Compute p-hat for each poll
ex1_props <- all_polls %>% 
  # Group by poll
  ___(___) %>% 
  # Calculate proportion of yes votes
  ___(stat = ___(___))
  
# Review the result
ex1_props
Code bearbeiten und ausführen