Effets de la proportion observée sur les IC par bootstrap
Un autre élément qui influence la largeur de l’intervalle de confiance est la valeur du paramètre estimé dans l’échantillon, \(\hat{p}\).
En général, lorsque le vrai paramètre est proche de 0,5, l’erreur standard de \(\hat{p}\) est plus grande que lorsque le vrai paramètre est plus proche de 0 ou de 1. Lorsqu’on calcule un intervalle de confiance t par bootstrap, l’erreur standard détermine la largeur de l’IC et, ici (étant donné un vrai paramètre de 0,8), la proportion observée est plus élevée que dans les exercices précédents ; la largeur de l’intervalle de confiance sera donc plus étroite.
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
calc_p_hat()est présenté dans le script pour calculer les proportions observées.calc_t_conf_int()de l’exercice précédent a été mis à jour pour accepter n’importe quelle valeur dep_haten argument. Lisez leurs définitions et essayez de les comprendre.- Exécutez le code pour calculer l’intervalle de confiance t par bootstrap pour la population d’origine.
- Considérez une nouvelle population où le vrai paramètre vaut 0,8,
one_poll_0.8. Calculez \(\hat{p}\) pour ce nouvel échantillon, en utilisant la même technique que pour le jeu de données d’origine. Nommez-lep_hat_0.8. - Trouvez l’intervalle de confiance t par bootstrap en utilisant les nouvelles données bootstrapées,
one_poll_boot_0.8, et le nouveau \(\hat{p}\). Remarquez qu’il est plus étroit que celui calculé précédemment.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
calc_p_hat <- function(dataset) {
dataset %>%
summarize(stat = mean(vote == "yes")) %>%
pull()
}
calc_t_conf_int <- function(resampled_dataset, p_hat) {
resampled_dataset %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
}
# Find proportion of yes votes from original population
p_hat <- calc_p_hat(one_poll)
# Review the value
p_hat
# Calculate bootstrap t-confidence interval (original 0.6 param)
calc_t_conf_int(one_poll_boot, p_hat)
# Find proportion of yes votes from new population
p_hat_0.8 <- ___
# Review the value
p_hat_0.8
# Calculate the bootstrap t-confidence interval (new 0.8 param)
___