Costruire un IC

Hai visto un esempio di come p-cappello possa variare con il ricampionamento, ma dobbiamo farlo molte, molte volte per stimarne bene la variabilità. Qui calcolerai un'intera distribuzione bootstrap per stimare l'errore standard (SE) che userai per costruire un intervallo di confidenza. Userai un verbo aggiuntivo di infer, calculate(), per velocizzare il calcolo di molte statistiche da molti insiemi di dati.

Dedica un attimo a osservare l’output di calculate. Questa funzione riduce il tuo data frame a sole due colonne: una per le "stat" e un’altra per la "replicate" a cui corrispondono.

Quando tracci la distribuzione bootstrap, noterai che ha una forma a campana. È proprio questa forma che ti permette di sommare e sottrarre due SE per ottenere un intervallo al 95%.

Questo esercizio fa parte del corso

Inferenza per dati categorici in R

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create bootstrap distribution for proportion with High conf
boot_dist <- gss2016 %>%
  # Specify the response and success
  specify(response = ___, ___ = "___") %>%
  # Generate 500 bootstrap reps
  generate(___ = ___, type = "bootstrap") %>%
  # Calculate proportions
  calculate(stat = "___")

# See the result
boot_dist

Modifica ed esegui il codice