Effets de la proportion observée sur les IC par bootstrap

Un autre élément qui influence la largeur de l’intervalle de confiance est la valeur du paramètre estimé dans l’échantillon, \(\hat{p}\).

En général, lorsque le vrai paramètre est proche de 0,5, l’erreur standard de \(\hat{p}\) est plus grande que lorsque le vrai paramètre est plus proche de 0 ou de 1. Lorsqu’on calcule un intervalle de confiance t par bootstrap, l’erreur standard détermine la largeur de l’IC et, ici (étant donné un vrai paramètre de 0,8), la proportion observée est plus élevée que dans les exercices précédents ; la largeur de l’intervalle de confiance sera donc plus étroite.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

calc_p_hat() est présenté dans le script pour calculer les proportions observées. calc_t_conf_int() de l’exercice précédent a été mis à jour pour accepter n’importe quelle valeur de p_hat en argument. Lisez leurs définitions et essayez de les comprendre.
Exécutez le code pour calculer l’intervalle de confiance t par bootstrap pour la population d’origine.
Considérez une nouvelle population où le vrai paramètre vaut 0,8, one_poll_0.8. Calculez \(\hat{p}\) pour ce nouvel échantillon, en utilisant la même technique que pour le jeu de données d’origine. Nommez-le p_hat_0.8.
Trouvez l’intervalle de confiance t par bootstrap en utilisant les nouvelles données bootstrapées, one_poll_boot_0.8, et le nouveau \(\hat{p}\). Remarquez qu’il est plus étroit que celui calculé précédemment.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

calc_p_hat <- function(dataset) {
  dataset %>%
    summarize(stat = mean(vote == "yes")) %>%
    pull()
}
calc_t_conf_int <- function(resampled_dataset, p_hat) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find proportion of yes votes from original population
p_hat <- calc_p_hat(one_poll)

# Review the value
p_hat  

# Calculate bootstrap t-confidence interval (original 0.6 param)
calc_t_conf_int(one_poll_boot, p_hat)

# Find proportion of yes votes from new population
p_hat_0.8 <- ___
  
# Review the value
p_hat_0.8  
  
# Calculate the bootstrap t-confidence interval (new 0.8 param)
___

Modifier et exécuter le code