Effets de la taille d’échantillon sur les IC bootstrap
Dans un exercice à choix multiples précédent, vous avez constaté que si vous rééchantillonnez les données avec une mauvaise taille (par exemple 300 ou 3 au lieu de 30), l’erreur standard (SE) des proportions d’échantillon est faussée. Avec 300 observations rééchantillonnées, la SE était trop petite. Avec 3 observations rééchantillonnées, la SE était trop grande.
Ici, vous allez utiliser l’erreur standard incorrecte (basée sur une taille d’échantillon erronée) pour construire un intervalle de confiance. L’idée est que lorsque l’erreur standard est biaisée, l’intervalle n’est ni très utile ni correct.
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
- Une fonction pour calculer l’intervalle de confiance t bootstrap,
calc_t_conf_int(), est affichée dans le script. Lisez le code et essayez de le comprendre. - Appelez
calc_t_conf_int()surone_poll_bootpour calculer l’intervalle de confiance t correct. - Faites de même sur
one_poll_boot_300, pour obtenir un intervalle incorrect pour les rééchantillonnages de taille 300. - Faites de même sur
one_poll_boot_3, pour obtenir un intervalle incorrect pour les rééchantillonnages de taille 3.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
calc_t_conf_int <- function(resampled_dataset) {
resampled_dataset %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
}
# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)
# ... and for 300 resamples
___
# ... and for 3 resamples
___