Effetti del valore della proporzione campionaria sugli IC bootstrap
Un ulteriore elemento che modifica l’ampiezza dell’intervallo di confidenza è il valore del parametro campionario, \(\hat{p}\).
In generale, quando il vero parametro è vicino a 0,5, l’errore standard di \(\hat{p}\) è maggiore rispetto a quando il vero parametro è vicino a 0 o 1. Quando si calcola un intervallo di confidenza t con bootstrap, l’errore standard determina l’ampiezza dell’IC e qui (dato un vero parametro di 0,8) la proporzione campionaria è più alta rispetto agli esercizi precedenti, quindi l’intervallo di confidenza risulterà più stretto.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Istruzioni dell'esercizio
calc_p_hat()è mostrata nello script per calcolare le proporzioni campionarie.calc_t_conf_int()dell’esercizio precedente è stata aggiornata per usare ora qualsiasi valore dip_hatcome argomento. Leggi le loro definizioni e prova a capirle.- Esegui il codice per calcolare l’intervallo di confidenza t con bootstrap per la popolazione originale.
- Considera una nuova popolazione in cui il vero parametro è 0,8,
one_poll_0.8. Calcola \(\hat{p}\) di questo nuovo campione, usando la stessa tecnica del dataset originale. Chiamalop_hat_0.8. - Trova l’intervallo di confidenza t con bootstrap usando i nuovi dati bootstrap,
one_poll_boot_0.8, e il nuovo \(\hat{p}\). Nota che è più stretto rispetto a quello calcolato in precedenza.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
calc_p_hat <- function(dataset) {
dataset %>%
summarize(stat = mean(vote == "yes")) %>%
pull()
}
calc_t_conf_int <- function(resampled_dataset, p_hat) {
resampled_dataset %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
}
# Find proportion of yes votes from original population
p_hat <- calc_p_hat(one_poll)
# Review the value
p_hat
# Calculate bootstrap t-confidence interval (original 0.6 param)
calc_t_conf_int(one_poll_boot, p_hat)
# Find proportion of yes votes from new population
p_hat_0.8 <- ___
# Review the value
p_hat_0.8
# Calculate the bootstrap t-confidence interval (new 0.8 param)
___