Konstruieren eines KI
Du hast ein Beispiel gesehen, wie sich p-dach beim Resampling ändern kann, aber wir müssen das sehr oft wiederholen, um eine gute Schätzung seiner Variabilität zu erhalten. Hier berechnest du eine vollständige Bootstrap-Verteilung, um den Standardfehler (SE) zu schätzen, der für ein Konfidenzintervall verwendet wird. Dafür nutzt du ein weiteres Verb aus infer, calculate(), um das Berechnen vieler Statistiken aus vielen Datensätzen zu vereinfachen.
Nimm dir einen Moment, um die Ausgabe von calculate zu prüfen. Diese Funktion reduziert deinen Data Frame auf genau zwei Spalten: eine für die „stat“s und eine andere für die „replicate“, zu denen sie gehören.
Wenn du deine Bootstrap-Verteilung plottest, wirst du feststellen, dass sie glockenförmig ist. Diese Form ermöglicht es dir, zwei SE zu addieren bzw. zu subtrahieren, um ein 95%-Intervall zu erhalten.
Diese Übung ist Teil des Kurses
Schlussfolgern für kategoriale Daten in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist