Bootstrap percentiel-interval
Het hoofdidee in de vorige oefening was dat de afstand tussen de oorspronkelijke steekproef \(\hat{p}\) en de hertrokken (of gebootstrapte) \(\hat{p}^*\)-waarden een maat geeft voor hoe ver de oorspronkelijke \(\hat{p}\) van de werkelijke populatieproportie afligt.
Diezelfde variabiliteit kun je op een andere manier meten. Net als daarvoor geldt: als \(\hat{p}\) dicht genoeg bij de echte parameter ligt, dan zullen de hertrokken (gebootstrapte) \(\hat{p}^*\)-waarden zo variëren dat ze overlappen met de echte parameter.
In plaats van \(\pm 2 SE\) te gebruiken om de middelste 95% van de bemonsterde \(\hat{p}\)-waarden te meten, kun je het midden van de hertrokken \(\hat{p}^*\)-waarden vinden door de bovenste en onderste 2,5% weg te laten. Let op: deze tweede manier om bootstrap-intervallen te construeren geeft ook een intuïtieve manier om 90%- of 99%-betrouwbaarheidsintervallen te maken, naast 95%-intervallen.
De gebootstrapte resamples, one_poll_boot, en de proportie ja-stemmen, p_hat, zijn beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# From previous exercise: bootstrap t-confidence interval
one_poll_boot %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
# Manually calculate a 95% percentile interval
one_poll_boot %>%
summarize(
lower = ___(stat, p = ___),
upper = ___
)