Effets de la taille d’échantillon sur les IC bootstrap

Dans un exercice à choix multiples précédent, vous avez constaté que si vous rééchantillonnez les données avec une mauvaise taille (par exemple 300 ou 3 au lieu de 30), l’erreur standard (SE) des proportions d’échantillon est faussée. Avec 300 observations rééchantillonnées, la SE était trop petite. Avec 3 observations rééchantillonnées, la SE était trop grande.

Ici, vous allez utiliser l’erreur standard incorrecte (basée sur une taille d’échantillon erronée) pour construire un intervalle de confiance. L’idée est que lorsque l’erreur standard est biaisée, l’intervalle n’est ni très utile ni correct.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

Une fonction pour calculer l’intervalle de confiance t bootstrap, calc_t_conf_int(), est affichée dans le script. Lisez le code et essayez de le comprendre.
Appelez calc_t_conf_int() sur one_poll_boot pour calculer l’intervalle de confiance t correct.
Faites de même sur one_poll_boot_300, pour obtenir un intervalle incorrect pour les rééchantillonnages de taille 300.
Faites de même sur one_poll_boot_3, pour obtenir un intervalle incorrect pour les rééchantillonnages de taille 3.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

calc_t_conf_int <- function(resampled_dataset) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)

# ... and for 300 resamples
___

# ... and for 3 resamples
___

Modifier et exécuter le code