Construindo um IC

Você viu um exemplo de como p-chapéu pode variar ao reamostrar, mas precisamos fazer isso muitas e muitas vezes para obter uma boa estimativa de sua variabilidade. Aqui, você vai calcular uma distribuição bootstrap completa para estimar o erro-padrão (SE), que será usado para formar um intervalo de confiança. Você usará um verbo adicional do pacote infer, calculate(), para agilizar esse processo de calcular muitas estatísticas a partir de muitos conjuntos de dados.

Reserve um momento para inspecionar a saída de calculate. Essa função reduz seu data frame a apenas duas colunas: uma para as "stat" e outra para o "replicate" ao qual elas correspondem.

Ao plotar sua distribuição bootstrap, você verá que ela tem formato de sino. É esse formato que permite somar e subtrair dois SEs para obter um intervalo de 95%.

Este exercício faz parte do curso

Inferência para Dados Categóricos em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
  # Specify the response and success
  specify(response = ___, ___ = "___") %>%
  # Generate 500 bootstrap reps
  generate(___ = ___, type = "bootstrap") %>%
  # Calculate proportions
  calculate(stat = "___")

# See the result
boot_dist

Editar e executar o código