Intervallo percentile bootstrap

L'idea principale dell'esercizio precedente era che la distanza tra il campione originale \(\hat{p}\) e i valori ricampionati (o bootstrap) \(\hat{p}^*\) fornisce una misura di quanto l'originale \(\hat{p}\) sia distante dalla vera proporzione nella popolazione.

La stessa variabilità può essere misurata con un meccanismo diverso. Come prima, se \(\hat{p}\) è sufficientemente vicino al vero parametro, allora i valori ricampionati (bootstrap) \(\hat{p}^*\) varieranno in modo tale da sovrapporsi al vero parametro.

Invece di usare \(\pm 2 SE\) per misurare il 95% centrale dei valori campionati di \(\hat{p}\), puoi trovare la parte centrale dei valori ricampionati \(\hat{p}^*\) rimuovendo il 2,5% superiore e inferiore. Nota che questo secondo metodo per costruire intervalli bootstrap offre anche un modo intuitivo per creare intervalli di confidenza al 90% o al 99%, oltre che al 95%.

I ricampionamenti bootstrap, one_poll_boot, e la proporzione di voti "sì", p_hat, sono disponibili nel tuo workspace.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# From previous exercise: bootstrap t-confidence interval
one_poll_boot %>%
  summarize(
    lower = p_hat - 2 * sd(stat),
    upper = p_hat + 2 * sd(stat)
  )
  
# Manually calculate a 95% percentile interval
one_poll_boot %>%
  summarize(
    lower = ___(stat, p = ___),
    upper = ___
  )

Modifica ed esegui il codice