Estimation avec et sans valeur aberrante
Les données fournies dans cet exercice (hypdata_outlier) contiennent une valeur aberrante extrême. Un graphique du jeu de données est affiché, ainsi qu’un modèle de régression linéaire de response en fonction de explanatory. Vous allez retirer le point aberrant pour voir comment une seule observation peut influencer l’estimation de la droite.
Cet exercice fait partie du cours
Inférence pour la régression linéaire en R
Instructions
- Filtrez
hypdata_outlierpour supprimer la valeur aberrante. - Mettez à jour le graphique
ppour ajouter une autre couche lissée (utilisezgeom_smooth).- Comme pour l’autre ruban, la mise à jour doit utiliser la méthode de régression linéaire et ne pas tracer le ruban.
- Contrairement à l’autre ruban, la mise à jour doit utiliser
data = hypdata_no_outlieret être colorée en rouge. - Pour l’instant, utilisez uniquement la courbe lissée, sans les bornes de confiance (
se = FALSE).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
# Filter to remove the outlier
hypdata_no_outlier <- ___
p +
# Add another smooth lin .reg. layer, no ribbon,
# hypdata_no_outlier data, colored red
___