Null-Stichprobenverteilung der Steigung

Im vorherigen Kapitel hast du die Stichprobenverteilung der Steigung aus einer Population betrachtet, in der die Steigung ungleich null war. Für Inferenz brauchst du jedoch typischerweise die Stichprobenverteilung der Steigung unter der Annahme, dass es keinen Zusammenhang zwischen erklärender und Zielvariable gibt. Außerdem kennst du in den meisten Situationen die Grundgesamtheit nicht, aus der die Daten stammen, sodass die Null-Stichprobenverteilung ausschließlich aus dem ursprünglichen Datensatz abgeleitet werden muss.

Mitte des 20. Jahrhunderts wurde eine Studie durchgeführt, in der eineiige Zwillinge aufgespürt wurden, die bei der Geburt getrennt wurden: Ein Kind wuchs bei den leiblichen Eltern auf, das andere in einer Pflegefamilie. Um der Frage nachzugehen, ob Intelligenz eher von Anlage oder Umwelt geprägt ist, erhielten beide Kinder IQ-Tests. Die resultierenden Daten enthalten die IQs der Pflege-Zwillinge (Foster ist die Zielvariable) und die IQs der leiblichen Zwillinge (Biological ist die erklärende Variable).

In dieser Übung verwendest du die Funktion pull(). Diese Funktion nimmt ein Data Frame und gibt eine ausgewählte Spalte als Vektor zurück (ähnlich wie $).

Diese Übung ist Teil des Kurses

<Kurs>Schlussfolgern bei der linearen Regression in R</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

library(infer)

# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
  # Tidy the result
  ___() %>%   
  # Filter for rows where term equal Biological
  ___(___) %>%
  # Pull out the estimate column
  ___(___) 

# See the result
obs_slope

Code bearbeiten und ausführen