CommencerCommencer gratuitement

Estimation avec et sans valeur aberrante

Les données fournies dans cet exercice (hypdata_outlier) contiennent une valeur aberrante extrême. Un graphique du jeu de données est affiché, ainsi qu’un modèle de régression linéaire de response en fonction de explanatory. Vous allez retirer le point aberrant pour voir comment une seule observation peut influencer l’estimation de la droite.

Cet exercice fait partie du cours

Inférence pour la régression linéaire en R

Afficher le cours

Instructions

  • Filtrez hypdata_outlier pour supprimer la valeur aberrante.
  • Mettez à jour le graphique p pour ajouter une autre couche lissée (utilisez geom_smooth).
    • Comme pour l’autre ruban, la mise à jour doit utiliser la méthode de régression linéaire et ne pas tracer le ruban.
    • Contrairement à l’autre ruban, la mise à jour doit utiliser data = hypdata_no_outlier et être colorée en rouge.
    • Pour l’instant, utilisez uniquement la courbe lissée, sans les bornes de confiance (se = FALSE).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) 

# Filter to remove the outlier
hypdata_no_outlier <- ___

p +
  # Add another smooth lin .reg. layer, no ribbon, 
  # hypdata_no_outlier data, colored red
  ___
Modifier et exécuter le code