Superponer líneas
Basándote en el ejercicio anterior, ahora repetirás el proceso de muestreo 100 veces para visualizar la distribución muestral de las rectas de regresión generadas por 100 muestras aleatorias distintas de la población.
En lugar de llamar repetidamente a sample_n(), como hiciste en el ejercicio anterior, rep_sample_n() del paquete oilabs ofrece una forma cómoda de generar muchas muestras aleatorias. La función rep_sample_n() repite el comando sample_n() reps veces.
La función do() de dplyr te permitirá ejecutar la llamada a lm por separado para cada nivel de una variable que haya sido agrupada con group_by(). Aquí, la variable de agrupación es la réplica de muestreo, por lo que cada lm se ejecuta sobre una muestra aleatoria distinta de los datos.
Este ejercicio forma parte del curso
Inferencia para la regresión lineal en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set the seed for reproducibility
set.seed(4747)
# Repeatedly sample the population without replacement
many_samples <- popdata %>%
___
# See the result
glimpse(many_samples)