Ricampionare da un campione
Per studiare quanto cambiano, da campione a campione, le stime di una proporzione di popolazione, imposterai due esperimenti di campionamento.
Nel primo esperimento simulerai campioni ripetuti da una popolazione. Nel secondo, sceglierai un singolo campione dal primo esperimento e ricampionerai ripetutamente da quel campione: un metodo chiamato bootstrapping. Più nello specifico:
Esperimento 1: supponi che la vera proporzione di persone che voteranno per il Candidato X sia 0,6. Campiona ripetutamente 30 persone dalla popolazione e misura la variabilità di \(\hat{p}\) (la proporzione del campione).
Esperimento 2: prendi un campione di dimensione 30 dalla stessa popolazione. Campiona ripetutamente 30 persone (con reinserimento!) dal campione originale e misura la variabilità di \(\hat{p}^*\) (la proporzione del ricampionamento).
È importante capire che il primo esperimento si basa sulla conoscenza della popolazione ed è tipicamente impossibile nella pratica. Il secondo si basa solo sul campione di dati ed è quindi facile da implementare per qualsiasi statistica. Fortunatamente, come vedrai, la variabilità di \(\hat{p}\), cioè la proporzione di "successi" in un campione, è approssimativamente la stessa sia che campioniamo dalla popolazione sia che ricampioniamo da un campione.
Abbiamo creato 1000 campioni casuali, ciascuno di dimensione 30, dalla popolazione. Il data frame risultante, all_polls, è disponibile nel tuo workspace. Dagli un'occhiata prima di iniziare.
Questo esercizio fa parte del corso
Fondamenti di inferenza in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute p-hat for each poll
ex1_props <- all_polls %>%
# Group by poll
___(___) %>%
# Calculate proportion of yes votes
___(stat = ___(___))
# Review the result
ex1_props