Bootstrap percentiel-interval

Het hoofdidee in de vorige oefening was dat de afstand tussen de oorspronkelijke steekproef \(\hat{p}\) en de hertrokken (of gebootstrapte) \(\hat{p}^*\)-waarden een maat geeft voor hoe ver de oorspronkelijke \(\hat{p}\) van de werkelijke populatieproportie afligt.

Diezelfde variabiliteit kun je op een andere manier meten. Net als daarvoor geldt: als \(\hat{p}\) dicht genoeg bij de echte parameter ligt, dan zullen de hertrokken (gebootstrapte) \(\hat{p}^*\)-waarden zo variëren dat ze overlappen met de echte parameter.

In plaats van \(\pm 2 SE\) te gebruiken om de middelste 95% van de bemonsterde \(\hat{p}\)-waarden te meten, kun je het midden van de hertrokken \(\hat{p}^*\)-waarden vinden door de bovenste en onderste 2,5% weg te laten. Let op: deze tweede manier om bootstrap-intervallen te construeren geeft ook een intuïtieve manier om 90%- of 99%-betrouwbaarheidsintervallen te maken, naast 95%-intervallen.

De gebootstrapte resamples, one_poll_boot, en de proportie ja-stemmen, p_hat, zijn beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# From previous exercise: bootstrap t-confidence interval
one_poll_boot %>%
  summarize(
    lower = p_hat - 2 * sd(stat),
    upper = p_hat + 2 * sd(stat)
  )
  
# Manually calculate a 95% percentile interval
one_poll_boot %>%
  summarize(
    lower = ___(stat, p = ___),
    upper = ___
  )

Code bewerken en uitvoeren