Intervalos de confianza para la respuesta media en todas las observaciones
El intervalo de confianza para la respuesta media se puede calcular para todas las observaciones del conjunto de datos. Usar augment() directamente sobre el conjunto twins proporciona predicciones y errores estándar para el gemelo Foster basados en todas las observaciones de Biological.
Ten en cuenta que el cálculo de la recta de regresión es más estable en el centro, así que las predicciones para valores extremos son más variables que las predicciones en la zona intermedia de los CI explicativos.
Las predicciones del CI del gemelo Foster que calculaste antes se proporcionan como predictions. Estas predicciones se muestran en un gráfico usando geom_smooth().
Este ejercicio forma parte del curso
Inferencia para la regresión lineal en R
Instrucciones del ejercicio
Crea manualmente lo que hace geom_smooth() usando predictions. Proporciona las estéticas y los datos a cada geom.
- Añade una capa de puntos de
Fosterfrente aBiological, usando el conjuntodata = twins. - Añade una capa de línea de
.fittedfrente aBiological, usando el conjuntodata = predictions. Colorea la línea de"blue". - Añade una capa de ribbon con
xmapeado aBiological,yminmapeado alower_mean_predictionyymaxmapeado aupper_mean_prediction. Usa el conjuntodata = predictionsy establece la transparencia,alpha, en0.2.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# This plot is shown
ggplot(twins, aes(x = Biological, y = Foster)) +
geom_point() +
geom_smooth(method = "lm")
ggplot() +
# Add a point layer of Foster vs. Biological, using twins
___(aes(___, ___), data = ___) +
# Add a line layer of .fitted vs Biological, using predictions, colored blue
___ +
# Add a ribbon layer of lower_mean_prediction to upper_mean_prediction vs Biological,
# using predictions, transparency of 0.2
___