Effekte der Stichprobengröße auf Bootstrap-KIs
In einer früheren Multiple-Choice-Aufgabe hast du gesehen, dass beim erneuten Ziehen der Daten mit der falschen Größe (z. B. 300 oder 3 statt 30) der Standardfehler (SE) der Stichprobenanteile nicht stimmt. Bei 300 erneut gezogenen Beobachtungen war der SE zu klein. Bei 3 erneut gezogenen Beobachtungen war der SE zu groß.
Hier verwendest du den falschen Standardfehler (basierend auf der falschen Stichprobengröße), um ein Konfidenzintervall zu erstellen. Die Idee dahinter: Wenn der Standardfehler danebenliegt, ist das Intervall weder besonders nützlich noch korrekt.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
- Eine Funktion zur Berechnung des gebootstrappten t‑Konfidenzintervalls,
calc_t_conf_int(), ist im Skript dargestellt. Lies den Code und versuche, ihn nachzuvollziehen. - Rufe
calc_t_conf_int()aufone_poll_bootauf, um das korrekte t‑Konfidenzintervall zu berechnen. - Mach dasselbe für
one_poll_boot_300, um ein falsches Intervall für die Resamples der Größe 300 zu erhalten. - Mach dasselbe für
one_poll_boot_3, um ein falsches Intervall für die Resamples der Größe 3 zu erhalten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
calc_t_conf_int <- function(resampled_dataset) {
resampled_dataset %>%
summarize(
lower = p_hat - 2 * sd(stat),
upper = p_hat + 2 * sd(stat)
)
}
# Find the bootstrap t-confidence interval for 30 resamples
calc_t_conf_int(___)
# ... and for 300 resamples
___
# ... and for 3 resamples
___