Inferenz mit und ohne Ausreißer (Randomisierung)
Mit dem Randomisierungstest kannst du erneut den Einfluss eines Ausreißers auf die inferenziellen Schlussfolgerungen eines linearen Modells beurteilen. Führe einen Randomisierungstest mit den Daten hypdata_out zweimal aus: einmal mit dem Ausreißerwert und einmal ohne ihn. Beachte, dass die ausführlichen Codezeilen die Schritte der Randomisierungstests klar kommunizieren.
Diese Übung ist Teil des Kurses
Schlussfolgern bei der linearen Regression in R
Anleitung zur Übung
Aus den Data Frames hypdata_out (mit Ausreißer) und hypdata_noout (Ausreißer entfernt) wurden die Data Frames perm_slope_out und perm_slope_noout erstellt, die jeweils die permutierten Steigungen der ursprünglichen Datensätze enthalten. Die beobachteten Werte sind in den Variablen obs_slope_out und obs_slope_noout gespeichert.
- Ermittle die p-Werte, indem du den Anteil der (
absoluten) permutierten Steigungen bestimmst, die größer oder gleich den (absoluten) beobachteten Steigungen sind. Verwende wie zuvormeanauf der binären Ungleichung, um den Anteil zu berechnen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate the p-value with the outlier
perm_slope_out %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)
# Calculate the p-value without the outlier
perm_slope_noout %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)