Linien überlagern
Aufbauend auf der vorherigen Übung wiederholst du den Stichprobenprozess jetzt 100-mal, um die Stichprobenverteilung von Regressionsgeraden zu visualisieren, die aus 100 verschiedenen Zufallsstichproben der Grundgesamtheit erzeugt wurden.
Anstatt wie in der vorherigen Übung wiederholt sample_n() aufzurufen, bietet rep_sample_n() aus dem Paket oilabs eine praktische Möglichkeit, viele Zufallsstichproben zu erzeugen. Die Funktion rep_sample_n() wiederholt den sample_n()-Befehl reps-mal.
Die Funktion do() aus dplyr ermöglicht es dir, den lm-Aufruf für jedes Level einer zuvor mit group_by() gebildeten Gruppe separat auszuführen. Hier ist die Gruppierungsvariable die Stichprobenreplikation, daher wird jedes lm auf einer anderen Zufallsstichprobe der Daten ausgeführt.
Diese Übung ist Teil des Kurses
<Kurs>Schlussfolgern bei der linearen Regression in R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Set the seed for reproducibility
set.seed(4747)
# Repeatedly sample the population without replacement
many_samples <- popdata %>%
___
# See the result
glimpse(many_samples)