Inferenz mit und ohne Ausreißer (Randomisierung)
Mit dem Randomisierungstest kannst du erneut den Einfluss eines Ausreißers auf die inferenziellen Schlussfolgerungen eines linearen Modells beurteilen. Führe einen Randomisierungstest mit den Daten hypdata_out zweimal aus: einmal mit dem Ausreißerwert und einmal ohne ihn. Beachte, dass die ausführlichen Codezeilen die Schritte der Randomisierungstests klar kommunizieren.
Diese Übung ist Teil des Kurses
<Kurs>Schlussfolgern bei der linearen Regression in R</Kurs>Übungsanweisungen
Aus den Data Frames hypdata_out (mit Ausreißer) und hypdata_noout (Ausreißer entfernt) wurden die Data Frames perm_slope_out und perm_slope_noout erstellt, die jeweils die permutierten Steigungen der ursprünglichen Datensätze enthalten. Die beobachteten Werte sind in den Variablen obs_slope_out und obs_slope_noout gespeichert.
- Ermittle die p-Werte, indem du den Anteil der (
absoluten) permutierten Steigungen bestimmst, die größer oder gleich den (absoluten) beobachteten Steigungen sind. Verwende wie zuvormeanauf der binären Ungleichung, um den Anteil zu berechnen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Calculate the p-value with the outlier
perm_slope_out %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)
# Calculate the p-value without the outlier
perm_slope_noout %>%
mutate(abs_perm_slope = ___) %>%
summarize(p_value = ___)