Bootstrap-t-Konfidenzintervall

Die vorherigen Übungen haben dir zwei Dinge gezeigt:

Du kannst die mit \(\hat{p}\) verbundene Variabilität messen, indem du aus der ursprünglichen Stichprobe erneut ziehst (Resampling).
Sobald du die Variabilität von \(\hat{p}\) kennst, kannst du sie nutzen, um zu messen, wie weit der wahre Anteil entfernt ist.

Beachte, dass sich die Rate der Nähe (hier 95 %) darauf bezieht, wie oft eine Stichprobe so gewählt wird, dass sie nahe am Populationsparameter liegt. Du wirst nie wissen, ob ein bestimmter Datensatz nahe am Parameter oder weit davon entfernt ist, aber du weißt, dass über deine Lebenszeit 95 % der von dir erhobenen Stichproben Schätzungen liefern sollten, die innerhalb von \(2SE\) des wahren Populationsparameters liegen.

Die Stimmen aus einer einzelnen Umfrage, one_poll, und die Daten aus 1000 Bootstrap-Resamples, one_poll_boot, stehen in deinem Workspace bereit. Diese basieren auf Experiment 2 von früher in diesem Kapitel.

Wie in der vorherigen Übung wird bei der Besprechung der Variabilität einer Kennzahl die Zahl als Standardfehler bezeichnet.

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in R</Kurs>

Kurs ansehen

Übungsanweisungen

Berechne \(\hat{p}\) und weise das Ergebnis p_hat zu. Berechne im Aufruf von summarize() stat als den Mittelwert davon, dass vote gleich "yes" ist.
Finde ein Intervall plausibler Werte für den wahren Parameter, indem du \(\hat{p} \pm 2SE\) berechnest.
- Die lower-Grenze des Konfidenzintervalls ist p_hat minus dem Doppelten des Standardfehlers von stat. Verwende sd(), um den Standardfehler zu berechnen.
- Die upper-Grenze ist p_hat plus dem Doppelten des Standardfehlers von stat.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# From previous exercises
one_poll <- all_polls %>%
  filter(poll == 1) %>%
  select(vote)
one_poll_boot <- one_poll %>%
  specify(response = vote, success = "yes") %>%
  generate(reps = 1000, type = "bootstrap") %>% 
  calculate(stat = "prop")
  
p_hat <- one_poll %>%
  # Calculate proportion of yes votes
  summarize(stat = ___) %>%
  pull()

# Create an interval of plausible values
one_poll_boot %>%
  summarize(
    # Lower bound is p_hat minus 2 std errs
    lower = ___,
    # Upper bound is p_hat plus 2 std errs
    upper = ___
  )

Code bearbeiten und ausführen