ComeçarComece de graça

Intervalo t de confiança via bootstrap

Os exercícios anteriores mostraram duas coisas:

  1. Você pode medir a variabilidade associada a \(\hat{p}\) reamostrando a partir da amostra original.
  2. Depois que você conhece a variabilidade de \(\hat{p}\), pode usá-la para medir quão distante está a proporção verdadeira.

Perceba que a taxa de proximidade (aqui, 95%) se refere a com que frequência uma amostra é escolhida de modo que fique próxima do parâmetro populacional. Você nunca saberá se um conjunto de dados específico está perto ou longe do parâmetro, mas sabe que, ao longo da sua vida, 95% das amostras que você coletar devem produzir estimativas dentro de \(2SE\) do verdadeiro parâmetro populacional.

Os votos de uma única pesquisa, one_poll, e os dados de 1000 reamostragens bootstrap, one_poll_boot, estão disponíveis no seu ambiente. Eles são baseados no Experimento 2 visto anteriormente no capítulo.

Como no exercício anterior, ao discutir a variabilidade de uma estatística, o número é chamado de erro padrão.

Este exercício faz parte do curso

Fundamentos de Inferência em R

Ver curso

Instruções do exercício

  • Calcule \(\hat{p}\) e atribua o resultado a p_hat. Na chamada a summarize(), calcule stat como a média de vote igual a "yes".
  • Encontre um intervalo de valores plausíveis para o parâmetro verdadeiro calculando $\hat{p} \pm 2SE`.
    • O limite lower do intervalo de confiança é p_hat menos duas vezes o erro padrão de stat. Use sd() para calcular o erro padrão.
    • O limite upper é p_hat mais duas vezes o erro padrão de stat.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# From previous exercises
one_poll <- all_polls %>%
  filter(poll == 1) %>%
  select(vote)
one_poll_boot <- one_poll %>%
  specify(response = vote, success = "yes") %>%
  generate(reps = 1000, type = "bootstrap") %>% 
  calculate(stat = "prop")
  
p_hat <- one_poll %>%
  # Calculate proportion of yes votes
  summarize(stat = ___) %>%
  pull()

# Create an interval of plausible values
one_poll_boot %>%
  summarize(
    # Lower bound is p_hat minus 2 std errs
    lower = ___,
    # Upper bound is p_hat plus 2 std errs
    upper = ___
  )
Editar e executar o código