Reamostrando a partir de uma amostra
Para investigar quanto as estimativas de uma proporção populacional variam de amostra para amostra, você vai configurar dois experimentos de amostragem.
No primeiro experimento, você vai simular amostras repetidas de uma população. No segundo, você vai escolher uma única amostra do primeiro experimento e reamostrar repetidamente dessa amostra: um método chamado bootstrapping. Mais especificamente:
Experimento 1: Assuma que a verdadeira proporção de pessoas que votarão no Candidato X é 0,6. Extraia repetidamente 30 pessoas da população e meça a variabilidade de \(\hat{p}\) (a proporção da amostra).
Experimento 2: Pegue uma amostra de tamanho 30 da mesma população. Reamostre repetidamente 30 pessoas (com reposição!) da amostra original e meça a variabilidade de \(\hat{p}^*\) (a proporção da reamostra).
É importante perceber que o primeiro experimento depende de conhecer a população e, na prática, geralmente é impossível. O segundo depende apenas da amostra de dados e, portanto, é fácil de implementar para qualquer estatística. Felizmente, como você verá, a variabilidade em \(\hat{p}\), ou a proporção de "sucessos" em uma amostra, é aproximadamente a mesma quer amostremos da população ou reamostremos de uma amostra.
Criamos 1000 amostras aleatórias, cada uma de tamanho 30, a partir da população. O data frame resultante, all_polls, está disponível no seu ambiente de trabalho. Dê uma olhada antes de começar.
Este exercício faz parte do curso
Fundamentos de Inferência em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute p-hat for each poll
ex1_props <- all_polls %>%
# Group by poll
___(___) %>%
# Calculate proportion of yes votes
___(stat = ___(___))
# Review the result
ex1_props