Intervallo percentile bootstrap
L'idea principale dell'esercizio precedente era che la distanza tra il campione originale \(\hat{p}\) e i valori ricampionati (o bootstrap) \(\hat{p}^*\) fornisce una misura di quanto l'originale \(\hat{p}\) sia distante dalla vera proporzione nella popolazione.
La stessa variabilità può essere misurata con un meccanismo diverso. Come prima, se \(\hat{p}\) è sufficientemente vicino al vero parametro, allora i valori ricampionati (bootstrap) \(\hat{p}^*\) varieranno in modo tale da sovrapporsi al vero parametro.
Invece di usare \(\pm 2 SE\) per misurare il 95% centrale dei valori campionati di \(\hat{p}\), puoi trovare la parte centrale dei valori ricampionati \(\hat{p}^*\) rimuovendo il 2,5% superiore e inferiore. Nota che questo secondo metodo per costruire intervalli bootstrap offre anche un modo intuitivo per creare intervalli di confidenza al 90% o al 99%, oltre che al 95%.
I ricampionamenti bootstrap, one_poll_boot, e la proporzione di voti "sì", p_hat, sono disponibili nel tuo workspace.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# From previous exercise: bootstrap t-confidence interval
one_poll_boot %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
# Manually calculate a 95% percentile interval
one_poll_boot %>%
summarize(
lower = ___(stat, p = ___),
upper = ___
)