Linien überlagern
Aufbauend auf der vorherigen Übung wiederholst du den Stichprobenprozess jetzt 100-mal, um die Stichprobenverteilung von Regressionsgeraden zu visualisieren, die aus 100 verschiedenen Zufallsstichproben der Grundgesamtheit erzeugt wurden.
Anstatt wie in der vorherigen Übung wiederholt sample_n() aufzurufen, bietet rep_sample_n() aus dem Paket oilabs eine praktische Möglichkeit, viele Zufallsstichproben zu erzeugen. Die Funktion rep_sample_n() wiederholt den sample_n()-Befehl reps-mal.
Die Funktion do() aus dplyr ermöglicht es dir, den lm-Aufruf für jedes Level einer zuvor mit group_by() gebildeten Gruppe separat auszuführen. Hier ist die Gruppierungsvariable die Stichprobenreplikation, daher wird jedes lm auf einer anderen Zufallsstichprobe der Daten ausgeführt.
Diese Übung ist Teil des Kurses
Schlussfolgern bei der linearen Regression in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set the seed for reproducibility
set.seed(4747)
# Repeatedly sample the population without replacement
many_samples <- popdata %>%
___
# See the result
glimpse(many_samples)