LoslegenKostenlos loslegen

Schätzung mit und ohne Ausreißer

Die in dieser Übung bereitgestellten Daten (hypdata_outlier) enthalten einen extremen Ausreißer. Es wird ein Plot des Datensatzes und ein lineares Regressionsmodell von response gegen explanatory gezeigt. Du entfernst den Ausreißer, um zu sehen, wie eine einzelne Beobachtung die Schätzung der Geraden beeinflussen kann.

Diese Übung ist Teil des Kurses

Schlussfolgern bei der linearen Regression in R

Kurs anzeigen

Anleitung zur Übung

  • Filtere hypdata_outlier, um den Ausreißer zu entfernen.
  • Aktualisiere den Plot p, um eine weitere Smooth-Schicht hinzuzufügen (verwende geom_smooth).
    • Wie beim anderen Band soll das Update die lineare Regressionsmethode nutzen und kein Band zeichnen.
    • Anders als beim anderen Band soll das Update data = hypdata_no_outlier verwenden und rot eingefärbt sein.
    • Verwende vorerst nur die Glättungskurve und nicht die Konfidenzgrenzen (se = FALSE).

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) + 
  geom_point() +
  geom_smooth(method = "lm", se = FALSE) 

# Filter to remove the outlier
hypdata_no_outlier <- ___

p +
  # Add another smooth lin .reg. layer, no ribbon, 
  # hypdata_no_outlier data, colored red
  ___
Code bearbeiten und ausführen