Effetti della dimensione del campione sugli IC bootstrap
In un precedente esercizio a scelta multipla, hai visto che se ricampioni i dati con una dimensione sbagliata (ad esempio 300 o 3 invece di 30), l'errore standard (SE) delle proporzioni campionarie risulta errato. Con 300 osservazioni ricampionate, il SE era troppo piccolo. Con 3 osservazioni ricampionate, il SE era troppo grande.
Qui userai l'errore standard non corretto (basato sulla dimensione del campione errata) per creare un intervallo di confidenza. L'idea è che quando l'errore standard è sbagliato, l'intervallo non è particolarmente utile, né corretto.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
- Nel file trovi una funzione per calcolare l'intervallo di confidenza t con bootstrap,
calc_t_conf_int(). Leggi il codice e prova a capirlo. - Chiama
calc_t_conf_int()suone_poll_bootper calcolare l'intervallo di confidenza t corretto. - Fai lo stesso su
one_poll_boot_300, per trovare un intervallo non corretto per i ricampionamenti di dimensione 300. - Fai lo stesso su
one_poll_boot_3, per trovare un intervallo non corretto per i ricampionamenti di dimensione 3.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
calc_t_conf_int <- function(resampled_dataset) {
resampled_dataset %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
}
# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)
# ... and for 300 resamples
___
# ... and for 3 resamples
___