CommencerCommencez gratuitement

Estimation avec et sans valeur aberrante

Les données fournies dans cet exercice (hypdata_outlier) contiennent une valeur aberrante extrême. Un graphique du jeu de données est affiché, ainsi qu’un modèle de régression linéaire de response en fonction de explanatory. Vous allez retirer le point aberrant pour voir comment une seule observation peut influencer l’estimation de la droite.

Cet exercice fait partie du cours

<cours>Inférence pour la régression linéaire en R</cours>
Voir le cours

Instructions de l’exercice

  • Filtrez hypdata_outlier pour supprimer la valeur aberrante.
  • Mettez à jour le graphique p pour ajouter une autre couche lissée (utilisez geom_smooth).
    • Comme pour l’autre ruban, la mise à jour doit utiliser la méthode de régression linéaire et ne pas tracer le ruban.
    • Contrairement à l’autre ruban, la mise à jour doit utiliser data = hypdata_no_outlier et être colorée en rouge.
    • Pour l’instant, utilisez uniquement la courbe lissée, sans les bornes de confiance (se = FALSE).

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) 

# Filter to remove the outlier
hypdata_no_outlier <- ___

p +
  # Add another smooth lin .reg. layer, no ribbon, 
  # hypdata_no_outlier data, colored red
  ___
Modifier et exécuter le code