Effect van steekproefgrootte op bootstrap-BI's

In een eerdere meerkeuzeoefening ontdekte je dat als je de data met een onjuiste grootte hersteekt (bijv. 300 of 3 in plaats van 30), de standaardfout (SE) van de steekproefproporties niet klopt. Met 300 hergetrokken observaties was de SE te klein. Met 3 hergetrokken observaties was de SE te groot.

Hier gebruik je de onjuiste standaardfout (gebaseerd op de verkeerde steekproefgrootte) om een betrouwbaarheidsinterval te maken. Het idee is dat wanneer de standaardfout niet klopt, het interval niet erg nuttig is en ook niet correct.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in R

Bekijk cursus

Oefeninstructies

In het script staat een functie om het get bootstrapte t-betrouwbaarheidsinterval te berekenen, calc_t_conf_int(). Lees de code en probeer te begrijpen wat er gebeurt.
Roep calc_t_conf_int() aan op one_poll_boot om het juiste t-betrouwbaarheidsinterval te berekenen.
Doe hetzelfde voor one_poll_boot_300 om een onjuist interval te vinden voor de hersteekproeven van grootte 300.
Doe hetzelfde voor one_poll_boot_3 om een onjuist interval te vinden voor de hersteekproeven van grootte 3.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

calc_t_conf_int <- function(resampled_dataset) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)

# ... and for 300 resamples
___

# ... and for 3 resamples
___

Code bewerken en uitvoeren