Estimación con y sin valor atípico
Los datos de este ejercicio (hypdata_outlier) incluyen un valor atípico extremo. Se muestra un gráfico del conjunto de datos y un modelo de regresión lineal de response frente a explanatory. Vas a eliminar el punto atípico para ver cómo una sola observación puede afectar a la estimación de la recta.
Este ejercicio forma parte del curso
Inferencia para la regresión lineal en R
Instrucciones del ejercicio
- Filtra
hypdata_outlierpara eliminar el valor atípico. - Actualiza el gráfico,
p, para añadir otra capa de suavizado (usageom_smooth).- Igual que la otra banda, la actualización debe usar el método de regresión lineal y no dibujar la banda.
- A diferencia de la otra banda, la actualización debe usar
data = hypdata_no_outliery estar en color rojo. - Por ahora, usa solo la curva suavizada y no los límites de confianza (
se = FALSE).
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
# Filter to remove the outlier
hypdata_no_outlier <- ___
p +
# Add another smooth lin .reg. layer, no ribbon,
# hypdata_no_outlier data, colored red
___