Auswirkungen des Stichprobenanteils auf Bootstrap-KIs

Ein weiterer Faktor, der die Breite des Konfidenzintervalls beeinflusst, ist der Wert des Stichprobenparameters, \(\hat{p}\).

Allgemein gilt: Ist der wahre Parameter nahe bei 0,5, ist der Standardfehler von \(\hat{p}\) größer, als wenn der wahre Parameter näher bei 0 oder 1 liegt. Beim Berechnen eines Bootstrap-t-Konfidenzintervalls bestimmt der Standardfehler die Breite der KI. Hier (bei einem wahren Parameter von 0,8) ist der Stichprobenanteil höher als in den vorherigen Übungen, daher wird das Konfidenzintervall schmaler ausfallen.

Diese Übung ist Teil des Kurses

Grundlagen der Inferenz in R

Kurs anzeigen

Anleitung zur Übung

calc_p_hat() ist im Skript enthalten, um die Stichprobenanteile zu berechnen. calc_t_conf_int() aus der vorherigen Übung wurde so aktualisiert, dass nun jeder Wert von p_hat als Argument genutzt werden kann. Lies dir die Definitionen durch und versuche, sie nachzuvollziehen.
Führe den Code aus, um das Bootstrap-t-Konfidenzintervall für die ursprüngliche Grundgesamtheit zu berechnen.
Betrachte eine neue Grundgesamtheit, in der der wahre Parameter 0,8 ist, one_poll_0.8. Berechne \(\hat{p}\) dieser neuen Stichprobe mit der gleichen Technik wie beim ursprünglichen Datensatz. Nenne ihn p_hat_0.8.
Bestimme das Bootstrap-t-Konfidenzintervall mit den neuen gebootstrappten Daten, one_poll_boot_0.8, und dem neuen \(\hat{p}\). Beachte, dass es schmaler ist als das zuvor berechnete.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

calc_p_hat <- function(dataset) {
  dataset %>%
    summarize(stat = mean(vote == "yes")) %>%
    pull()
}
calc_t_conf_int <- function(resampled_dataset, p_hat) {
  resampled_dataset %>%
    summarize(
      lower = p_hat - 2 * sd(stat),
      upper = p_hat + 2 * sd(stat)
    )
}

# Find proportion of yes votes from original population
p_hat <- calc_p_hat(one_poll)

# Review the value
p_hat  

# Calculate bootstrap t-confidence interval (original 0.6 param)
calc_t_conf_int(one_poll_boot, p_hat)

# Find proportion of yes votes from new population
p_hat_0.8 <- ___
  
# Review the value
p_hat_0.8  
  
# Calculate the bootstrap t-confidence interval (new 0.8 param)
___

Code bearbeiten und ausführen