Ricampionare da un campione

Per studiare quanto cambiano, da campione a campione, le stime di una proporzione di popolazione, imposterai due esperimenti di campionamento.

Nel primo esperimento simulerai campioni ripetuti da una popolazione. Nel secondo, sceglierai un singolo campione dal primo esperimento e ricampionerai ripetutamente da quel campione: un metodo chiamato bootstrapping. Più nello specifico:

Esperimento 1: supponi che la vera proporzione di persone che voteranno per il Candidato X sia 0,6. Campiona ripetutamente 30 persone dalla popolazione e misura la variabilità di \(\hat{p}\) (la proporzione del campione).

Esperimento 2: prendi un campione di dimensione 30 dalla stessa popolazione. Campiona ripetutamente 30 persone (con reinserimento!) dal campione originale e misura la variabilità di \(\hat{p}^*\) (la proporzione del ricampionamento).

È importante capire che il primo esperimento si basa sulla conoscenza della popolazione ed è tipicamente impossibile nella pratica. Il secondo si basa solo sul campione di dati ed è quindi facile da implementare per qualsiasi statistica. Fortunatamente, come vedrai, la variabilità di \(\hat{p}\), cioè la proporzione di "successi" in un campione, è approssimativamente la stessa sia che campioniamo dalla popolazione sia che ricampioniamo da un campione.

Abbiamo creato 1000 campioni casuali, ciascuno di dimensione 30, dalla popolazione. Il data frame risultante, all_polls, è disponibile nel tuo workspace. Dagli un'occhiata prima di iniziare.

Questo esercizio fa parte del corso

Fondamenti di inferenza in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Compute p-hat for each poll
ex1_props <- all_polls %>% 
  # Group by poll
  ___(___) %>% 
  # Calculate proportion of yes votes
  ___(stat = ___(___))
  
# Review the result
ex1_props

Modifica ed esegui il codice