Hertrekken uit een steekproef

Om te onderzoeken hoeveel de schattingen van een populatieproportie van steekproef tot steekproef veranderen, ga je twee steekproefexperimenten opzetten.

In het eerste experiment simuleer je herhaalde steekproeven uit een populatie. In het tweede kies je één enkele steekproef uit het eerste experiment en trek je daar herhaaldelijk nieuwe steekproeven uit: een methode die bootstrapping heet. Concreter:

Experiment 1: Neem aan dat de werkelijke proportie mensen die op Kandidaat X zullen stemmen 0,6 is. Trek herhaaldelijk 30 personen uit de populatie en meet de variabiliteit van \(\hat{p}\) (de steekproefproportie).

Experiment 2: Neem één steekproef van grootte 30 uit dezelfde populatie. Trek vervolgens herhaaldelijk 30 personen (met teruglegging!) uit de oorspronkelijke steekproef en meet de variabiliteit van \(\hat{p}^*\) (de hersteekproefproportie).

Het is belangrijk om te beseffen dat het eerste experiment ervan uitgaat dat je de populatie kent en in de praktijk meestal onmogelijk is. Het tweede is alleen afhankelijk van de steekproef en is daarom eenvoudig voor elk statistiek te implementeren. Gelukkig is, zoals je zult zien, de variabiliteit in \(\hat{p}\), ofwel de proportie "successen" in een steekproef, ongeveer gelijk, of we nu uit de populatie steekproeven trekken of hersteekproeven uit een steekproef.

We hebben 1000 willekeurige steekproeven, elk van grootte 30, uit de populatie gemaakt. Het resulterende data frame, all_polls, staat in je werkruimte. Kijk er even naar voordat je begint.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compute p-hat for each poll
ex1_props <- all_polls %>% 
  # Group by poll
  ___(___) %>% 
  # Calculate proportion of yes votes
  ___(stat = ___(___))
  
# Review the result
ex1_props

Code bewerken en uitvoeren