ComenzarEmpieza gratis

Estimación con y sin valor atípico

Los datos de este ejercicio (hypdata_outlier) incluyen un valor atípico extremo. Se muestra un gráfico del conjunto de datos y un modelo de regresión lineal de response frente a explanatory. Vas a eliminar el punto atípico para ver cómo una sola observación puede afectar a la estimación de la recta.

Este ejercicio forma parte del curso

Inferencia para la regresión lineal en R

Ver curso

Instrucciones del ejercicio

  • Filtra hypdata_outlier para eliminar el valor atípico.
  • Actualiza el gráfico, p, para añadir otra capa de suavizado (usa geom_smooth).
    • Igual que la otra banda, la actualización debe usar el método de regresión lineal y no dibujar la banda.
    • A diferencia de la otra banda, la actualización debe usar data = hypdata_no_outlier y estar en color rojo.
    • Por ahora, usa solo la curva suavizada y no los límites de confianza (se = FALSE).

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) 

# Filter to remove the outlier
hypdata_no_outlier <- ___

p +
  # Add another smooth lin .reg. layer, no ribbon, 
  # hypdata_no_outlier data, colored red
  ___
Editar y ejecutar código