Intervalo t de confiança via bootstrap
Os exercícios anteriores mostraram duas coisas:
- Você pode medir a variabilidade associada a \(\hat{p}\) reamostrando a partir da amostra original.
- Depois que você conhece a variabilidade de \(\hat{p}\), pode usá-la para medir quão distante está a proporção verdadeira.
Perceba que a taxa de proximidade (aqui, 95%) se refere a com que frequência uma amostra é escolhida de modo que fique próxima do parâmetro populacional. Você nunca saberá se um conjunto de dados específico está perto ou longe do parâmetro, mas sabe que, ao longo da sua vida, 95% das amostras que você coletar devem produzir estimativas dentro de \(2SE\) do verdadeiro parâmetro populacional.
Os votos de uma única pesquisa, one_poll, e os dados de 1000 reamostragens bootstrap, one_poll_boot, estão disponíveis no seu ambiente. Eles são baseados no Experimento 2 visto anteriormente no capítulo.
Como no exercício anterior, ao discutir a variabilidade de uma estatística, o número é chamado de erro padrão.
Este exercício faz parte do curso
Fundamentos de Inferência em R
Instruções do exercício
- Calcule \(\hat{p}\) e atribua o resultado a
p_hat. Na chamada asummarize(), calculestatcomo a média devoteigual a"yes". - Encontre um intervalo de valores plausíveis para o parâmetro verdadeiro calculando $\hat{p} \pm 2SE`.
- O limite
lowerdo intervalo de confiança ép_hatmenos duas vezes o erro padrão destat. Usesd()para calcular o erro padrão. - O limite
upperép_hatmais duas vezes o erro padrão destat.
- O limite
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# From previous exercises
one_poll <- all_polls %>%
filter(poll == 1) %>%
select(vote)
one_poll_boot <- one_poll %>%
specify(response = vote, success = "yes") %>%
generate(reps = 1000, type = "bootstrap") %>%
calculate(stat = "prop")
p_hat <- one_poll %>%
# Calculate proportion of yes votes
summarize(stat = ___) %>%
pull()
# Create an interval of plausible values
one_poll_boot %>%
summarize(
# Lower bound is p_hat minus 2 std errs
lower = ___,
# Upper bound is p_hat plus 2 std errs
upper = ___
)