Effetti della dimensione del campione sugli IC bootstrap

In un precedente esercizio a scelta multipla, hai visto che se ricampioni i dati con una dimensione sbagliata (ad esempio 300 o 3 invece di 30), l'errore standard (SE) delle proporzioni campionarie risulta errato. Con 300 osservazioni ricampionate, il SE era troppo piccolo. Con 3 osservazioni ricampionate, il SE era troppo grande.

Qui userai l'errore standard non corretto (basato sulla dimensione del campione errata) per creare un intervallo di confidenza. L'idea è che quando l'errore standard è sbagliato, l'intervallo non è particolarmente utile, né corretto.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

Istruzioni dell'esercizio

Nel file trovi una funzione per calcolare l'intervallo di confidenza t con bootstrap, calc_t_conf_int(). Leggi il codice e prova a capirlo.
Chiama calc_t_conf_int() su one_poll_boot per calcolare l'intervallo di confidenza t corretto.
Fai lo stesso su one_poll_boot_300, per trovare un intervallo non corretto per i ricampionamenti di dimensione 300.
Fai lo stesso su one_poll_boot_3, per trovare un intervallo non corretto per i ricampionamenti di dimensione 3.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

calc_t_conf_int <- function(resampled_dataset) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)

# ... and for 300 resamples
___

# ... and for 3 resamples
___

Modifica ed esegui il codice