Effetti del valore della proporzione campionaria sugli IC bootstrap

Un ulteriore elemento che modifica l’ampiezza dell’intervallo di confidenza è il valore del parametro campionario, \(\hat{p}\).

In generale, quando il vero parametro è vicino a 0,5, l’errore standard di \(\hat{p}\) è maggiore rispetto a quando il vero parametro è vicino a 0 o 1. Quando si calcola un intervallo di confidenza t con bootstrap, l’errore standard determina l’ampiezza dell’IC e qui (dato un vero parametro di 0,8) la proporzione campionaria è più alta rispetto agli esercizi precedenti, quindi l’intervallo di confidenza risulterà più stretto.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza corso

Istruzioni dell'esercizio

calc_p_hat() è mostrata nello script per calcolare le proporzioni campionarie. calc_t_conf_int() dell’esercizio precedente è stata aggiornata per usare ora qualsiasi valore di p_hat come argomento. Leggi le loro definizioni e prova a capirle.
Esegui il codice per calcolare l’intervallo di confidenza t con bootstrap per la popolazione originale.
Considera una nuova popolazione in cui il vero parametro è 0,8, one_poll_0.8. Calcola \(\hat{p}\) di questo nuovo campione, usando la stessa tecnica del dataset originale. Chiamalo p_hat_0.8.
Trova l’intervallo di confidenza t con bootstrap usando i nuovi dati bootstrap, one_poll_boot_0.8, e il nuovo \(\hat{p}\). Nota che è più stretto rispetto a quello calcolato in precedenza.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

calc_p_hat <- function(dataset) {
  dataset %>%
    summarize(stat = mean(vote == "yes")) %>%
    pull()
}
calc_t_conf_int <- function(resampled_dataset, p_hat) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find proportion of yes votes from original population
p_hat <- calc_p_hat(one_poll)

# Review the value
p_hat  

# Calculate bootstrap t-confidence interval (original 0.6 param)
calc_t_conf_int(one_poll_boot, p_hat)

# Find proportion of yes votes from new population
p_hat_0.8 <- ___
  
# Review the value
p_hat_0.8  
  
# Calculate the bootstrap t-confidence interval (new 0.8 param)
___

Modifica ed esegui il codice