Construire un IC
Vous avez vu un exemple montrant comment p-chapeau peut varier lors d’un rééchantillonnage, mais il faut répéter l’opération de très nombreuses fois pour estimer correctement sa variabilité. Ici, vous allez calculer une distribution bootstrap complète pour estimer l’erreur standard (SE) qui servira à construire un intervalle de confiance. Vous utiliserez un verbe supplémentaire du package infer, calculate(), pour automatiser le calcul de nombreuses statistiques sur de nombreux jeux de données.
Prenez un moment pour examiner la sortie de calculate. Cette fonction réduit votre data frame à seulement deux colonnes : l’une pour les « stat » et l’autre pour la « replicate » correspondante.
Lorsque vous tracez votre distribution bootstrap, vous constaterez qu’elle a une forme en cloche. C’est cette forme qui permet d’additionner et de soustraire deux SE pour obtenir un intervalle à 95 %.
Cet exercice fait partie du cours
Inférence pour des données catégorielles en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist