Konstruieren eines KI

Du hast ein Beispiel gesehen, wie sich p-dach beim Resampling ändern kann, aber wir müssen das sehr oft wiederholen, um eine gute Schätzung seiner Variabilität zu erhalten. Hier berechnest du eine vollständige Bootstrap-Verteilung, um den Standardfehler (SE) zu schätzen, der für ein Konfidenzintervall verwendet wird. Dafür nutzt du ein weiteres Verb aus infer, calculate(), um das Berechnen vieler Statistiken aus vielen Datensätzen zu vereinfachen.

Nimm dir einen Moment, um die Ausgabe von calculate zu prüfen. Diese Funktion reduziert deinen Data Frame auf genau zwei Spalten: eine für die „stat“s und eine andere für die „replicate“, zu denen sie gehören.

Wenn du deine Bootstrap-Verteilung plottest, wirst du feststellen, dass sie glockenförmig ist. Diese Form ermöglicht es dir, zwei SE zu addieren bzw. zu subtrahieren, um ein 95%-Intervall zu erhalten.

Diese Übung ist Teil des Kurses

<Kurs>Schlussfolgern für kategoriale Daten in R</Kurs>

Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
  # Specify the response and success
  specify(response = ___, ___ = "___") %>%
  # Generate 500 bootstrap reps
  generate(___ = ___, type = "bootstrap") %>%
  # Calculate proportions
  calculate(stat = "___")

# See the result
boot_dist

Code bearbeiten und ausführen