Construindo um IC
Você viu um exemplo de como p-chapéu pode variar ao reamostrar, mas precisamos fazer isso muitas e muitas vezes para obter uma boa estimativa de sua variabilidade. Aqui, você vai calcular uma distribuição bootstrap completa para estimar o erro-padrão (SE), que será usado para formar um intervalo de confiança. Você usará um verbo adicional do pacote infer, calculate(), para agilizar esse processo de calcular muitas estatísticas a partir de muitos conjuntos de dados.
Reserve um momento para inspecionar a saída de calculate. Essa função reduz seu data frame a apenas duas colunas: uma para as "stat" e outra para o "replicate" ao qual elas correspondem.
Ao plotar sua distribuição bootstrap, você verá que ela tem formato de sino. É esse formato que permite somar e subtrair dois SEs para obter um intervalo de 95%.
Este exercício faz parte do curso
Inferência para Dados Categóricos em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist