CommencerCommencer gratuitement

Effets de la proportion observée sur les IC par bootstrap

Un autre élément qui influence la largeur de l’intervalle de confiance est la valeur du paramètre estimé dans l’échantillon, \(\hat{p}\).

En général, lorsque le vrai paramètre est proche de 0,5, l’erreur standard de \(\hat{p}\) est plus grande que lorsque le vrai paramètre est plus proche de 0 ou de 1. Lorsqu’on calcule un intervalle de confiance t par bootstrap, l’erreur standard détermine la largeur de l’IC et, ici (étant donné un vrai paramètre de 0,8), la proportion observée est plus élevée que dans les exercices précédents ; la largeur de l’intervalle de confiance sera donc plus étroite.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

  • calc_p_hat() est présenté dans le script pour calculer les proportions observées. calc_t_conf_int() de l’exercice précédent a été mis à jour pour accepter n’importe quelle valeur de p_hat en argument. Lisez leurs définitions et essayez de les comprendre.
  • Exécutez le code pour calculer l’intervalle de confiance t par bootstrap pour la population d’origine.
  • Considérez une nouvelle population où le vrai paramètre vaut 0,8, one_poll_0.8. Calculez \(\hat{p}\) pour ce nouvel échantillon, en utilisant la même technique que pour le jeu de données d’origine. Nommez-le p_hat_0.8.
  • Trouvez l’intervalle de confiance t par bootstrap en utilisant les nouvelles données bootstrapées, one_poll_boot_0.8, et le nouveau \(\hat{p}\). Remarquez qu’il est plus étroit que celui calculé précédemment.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

calc_p_hat <- function(dataset) {
  dataset %>%
    summarize(stat = mean(vote == "yes")) %>%
    pull()
}
calc_t_conf_int <- function(resampled_dataset, p_hat) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find proportion of yes votes from original population
p_hat <- calc_p_hat(one_poll)

# Review the value
p_hat  

# Calculate bootstrap t-confidence interval (original 0.6 param)
calc_t_conf_int(one_poll_boot, p_hat)

# Find proportion of yes votes from new population
p_hat_0.8 <- ___
  
# Review the value
p_hat_0.8  
  
# Calculate the bootstrap t-confidence interval (new 0.8 param)
___
Modifier et exécuter le code