Effect van steekproefgrootte op bootstrap-BI's
In een eerdere meerkeuzeoefening ontdekte je dat als je de data met een onjuiste grootte hersteekt (bijv. 300 of 3 in plaats van 30), de standaardfout (SE) van de steekproefproporties niet klopt. Met 300 hergetrokken observaties was de SE te klein. Met 3 hergetrokken observaties was de SE te groot.
Hier gebruik je de onjuiste standaardfout (gebaseerd op de verkeerde steekproefgrootte) om een betrouwbaarheidsinterval te maken. Het idee is dat wanneer de standaardfout niet klopt, het interval niet erg nuttig is en ook niet correct.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in R
Oefeninstructies
- In het script staat een functie om het get bootstrapte t-betrouwbaarheidsinterval te berekenen,
calc_t_conf_int(). Lees de code en probeer te begrijpen wat er gebeurt. - Roep
calc_t_conf_int()aan opone_poll_bootom het juiste t-betrouwbaarheidsinterval te berekenen. - Doe hetzelfde voor
one_poll_boot_300om een onjuist interval te vinden voor de hersteekproeven van grootte 300. - Doe hetzelfde voor
one_poll_boot_3om een onjuist interval te vinden voor de hersteekproeven van grootte 3.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
calc_t_conf_int <- function(resampled_dataset) {
resampled_dataset %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
}
# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)
# ... and for 300 resamples
___
# ... and for 3 resamples
___