Bootstrap-t-Konfidenzintervall
Die vorherigen Übungen haben dir zwei Dinge gezeigt:
- Du kannst die mit \(\hat{p}\) verbundene Variabilität messen, indem du aus der ursprünglichen Stichprobe erneut ziehst (Resampling).
- Sobald du die Variabilität von \(\hat{p}\) kennst, kannst du sie nutzen, um zu messen, wie weit der wahre Anteil entfernt ist.
Beachte, dass sich die Rate der Nähe (hier 95 %) darauf bezieht, wie oft eine Stichprobe so gewählt wird, dass sie nahe am Populationsparameter liegt. Du wirst nie wissen, ob ein bestimmter Datensatz nahe am Parameter oder weit davon entfernt ist, aber du weißt, dass über deine Lebenszeit 95 % der von dir erhobenen Stichproben Schätzungen liefern sollten, die innerhalb von \(2SE\) des wahren Populationsparameters liegen.
Die Stimmen aus einer einzelnen Umfrage, one_poll, und die Daten aus 1000 Bootstrap-Resamples, one_poll_boot, stehen in deinem Workspace bereit. Diese basieren auf Experiment 2 von früher in diesem Kapitel.
Wie in der vorherigen Übung wird bei der Besprechung der Variabilität einer Kennzahl die Zahl als Standardfehler bezeichnet.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
- Berechne \(\hat{p}\) und weise das Ergebnis
p_hatzu. Berechne im Aufruf vonsummarize()statals den Mittelwert davon, dassvotegleich"yes"ist. - Finde ein Intervall plausibler Werte für den wahren Parameter, indem du \(\hat{p} \pm 2SE\) berechnest.
- Die
lower-Grenze des Konfidenzintervalls istp_hatminus dem Doppelten des Standardfehlers vonstat. Verwendesd(), um den Standardfehler zu berechnen. - Die
upper-Grenze istp_hatplus dem Doppelten des Standardfehlers vonstat.
- Die
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# From previous exercises
one_poll <- all_polls %>%
filter(poll == 1) %>%
select(vote)
one_poll_boot <- one_poll %>%
specify(response = vote, success = "yes") %>%
generate(reps = 1000, type = "bootstrap") %>%
calculate(stat = "prop")
p_hat <- one_poll %>%
# Calculate proportion of yes votes
summarize(stat = ___) %>%
pull()
# Create an interval of plausible values
one_poll_boot %>%
summarize(
# Lower bound is p_hat minus 2 std errs
lower = ___,
# Upper bound is p_hat plus 2 std errs
upper = ___
)