Null-Stichprobenverteilung der Steigung
Im vorherigen Kapitel hast du die Stichprobenverteilung der Steigung aus einer Population betrachtet, in der die Steigung ungleich null war. Für Inferenz brauchst du jedoch typischerweise die Stichprobenverteilung der Steigung unter der Annahme, dass es keinen Zusammenhang zwischen erklärender und Zielvariable gibt. Außerdem kennst du in den meisten Situationen die Grundgesamtheit nicht, aus der die Daten stammen, sodass die Null-Stichprobenverteilung ausschließlich aus dem ursprünglichen Datensatz abgeleitet werden muss.
Mitte des 20. Jahrhunderts wurde eine Studie durchgeführt, in der eineiige Zwillinge aufgespürt wurden, die bei der Geburt getrennt wurden: Ein Kind wuchs bei den leiblichen Eltern auf, das andere in einer Pflegefamilie. Um der Frage nachzugehen, ob Intelligenz eher von Anlage oder Umwelt geprägt ist, erhielten beide Kinder IQ-Tests. Die resultierenden Daten enthalten die IQs der Pflege-Zwillinge (Foster ist die Zielvariable) und die IQs der leiblichen Zwillinge (Biological ist die erklärende Variable).
In dieser Übung verwendest du die Funktion pull(). Diese Funktion nimmt ein Data Frame und gibt eine ausgewählte Spalte als Vektor zurück (ähnlich wie $).
Diese Übung ist Teil des Kurses
Schlussfolgern bei der linearen Regression in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
library(infer)
# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
# Tidy the result
___() %>%
# Filter for rows where term equal Biological
___(___) %>%
# Pull out the estimate column
___(___)
# See the result
obs_slope