Costruire un IC
Hai visto un esempio di come p-cappello possa variare con il ricampionamento, ma dobbiamo farlo molte, molte volte per stimarne bene la variabilità. Qui calcolerai un'intera distribuzione bootstrap per stimare l'errore standard (SE) che userai per costruire un intervallo di confidenza. Userai un verbo aggiuntivo di infer, calculate(), per velocizzare il calcolo di molte statistiche da molti insiemi di dati.
Dedica un attimo a osservare l’output di calculate. Questa funzione riduce il tuo data frame a sole due colonne: una per le "stat" e un’altra per la "replicate" a cui corrispondono.
Quando tracci la distribuzione bootstrap, noterai che ha una forma a campana. È proprio questa forma che ti permette di sommare e sottrarre due SE per ottenere un intervallo al 95%.
Questo esercizio fa parte del corso
Inferenza per dati categorici in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
# Specify the response and success
specify(response = ___, ___ = "___") %>%
# Generate 500 bootstrap reps
generate(___ = ___, type = "bootstrap") %>%
# Calculate proportions
calculate(stat = "___")
# See the result
boot_dist