Construir un IC
Ya has visto un ejemplo de cómo puede variar p-hat al re-muestrear, pero necesitamos hacerlo muchísimas veces para estimar bien su variabilidad. Aquí vas a calcular una distribución bootstrap completa para estimar el error estándar (SE), que se usará para formar un intervalo de confianza. Usarás un verbo adicional de infer, calculate(), para agilizar este proceso de calcular muchas estadísticas a partir de muchos conjuntos de datos.
Dedica un momento a revisar la salida de calculate. Esta función reduce tu data frame a solo dos columnas: una para las "stat" y otra para la "replicate" a la que corresponden.
Cuando representes tu distribución bootstrap, verás que tiene forma de campana. Esa forma es la que permite sumar y restar dos SE para obtener un intervalo del 95%.
Este ejercicio forma parte del curso
Inferencia para datos categóricos en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist