Schätzung mit und ohne Ausreißer
Die in dieser Übung bereitgestellten Daten (hypdata_outlier) enthalten einen extremen Ausreißer. Es wird ein Plot des Datensatzes und ein lineares Regressionsmodell von response gegen explanatory gezeigt. Du entfernst den Ausreißer, um zu sehen, wie eine einzelne Beobachtung die Schätzung der Geraden beeinflussen kann.
Diese Übung ist Teil des Kurses
Schlussfolgern bei der linearen Regression in R
Anleitung zur Übung
- Filtere
hypdata_outlier, um den Ausreißer zu entfernen. - Aktualisiere den Plot
p, um eine weitere Smooth-Schicht hinzuzufügen (verwendegeom_smooth).- Wie beim anderen Band soll das Update die lineare Regressionsmethode nutzen und kein Band zeichnen.
- Anders als beim anderen Band soll das Update
data = hypdata_no_outlierverwenden und rot eingefärbt sein. - Verwende vorerst nur die Glättungskurve und nicht die Konfidenzgrenzen (
se = FALSE).
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# This plot is shown
p <- ggplot(hypdata_outlier, aes(x = explanatory, y = response)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE)
# Filter to remove the outlier
hypdata_no_outlier <- ___
p +
# Add another smooth lin .reg. layer, no ribbon,
# hypdata_no_outlier data, colored red
___