Estimativa com e sem outlier
Os dados fornecidos neste exercício (hypdata_outlier) têm um outlier extremo. Um gráfico do conjunto de dados é exibido, junto com um modelo de regressão linear de response versus explanatory. Você vai remover o ponto discrepante para ver como uma única observação pode afetar a estimativa da reta.
Este exercício faz parte do curso
Inferência para Regressão Linear em R
Instruções do exercício
- Filtre
hypdata_outlierpara remover o outlier. - Atualize o gráfico
ppara adicionar outra camada de suavização (usegeom_smooth).- Assim como a outra faixa, a atualização deve usar o método de regressão linear e não desenhar a faixa.
- Diferentemente da outra faixa, a atualização deve usar
data = hypdata_no_outliere ser colorida de vermelho. - Por enquanto, use apenas a curva suavizada, sem os limites de confiança (
se = FALSE).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
# Filter to remove the outlier
hypdata_no_outlier <- ___
p +
# Add another smooth lin .reg. layer, no ribbon,
# hypdata_no_outlier data, colored red
___