ComenzarEmpieza gratis

Re-muestreo a partir de una muestra

Para investigar cuánto cambian las estimaciones de una proporción poblacional de una muestra a otra, vas a configurar dos experimentos de muestreo.

En el primer experimento, simularás muestras repetidas de una población. En el segundo, elegirás una única muestra del primer experimento y volverás a muestrear repetidamente de esa muestra: un método llamado bootstrapping. Más en detalle:

Experimento 1: Supón que la proporción verdadera de personas que votarán al Candidato X es 0.6. Muestra repetidamente 30 personas de la población y mide la variabilidad de \(\hat{p}\) (la proporción de la muestra).

Experimento 2: Toma una muestra de tamaño 30 de la misma población. Muestra repetidamente 30 personas (¡con reemplazo!) de la muestra original y mide la variabilidad de \(\hat{p}^*\) (la proporción del re-muestreo).

Es importante entender que el primer experimento depende de conocer la población y, en la práctica, suele ser imposible. El segundo solo depende de la muestra de datos y, por tanto, es fácil de implementar para cualquier estadístico. Por suerte, como verás, la variabilidad en \(\hat{p}\), es decir, la proporción de "éxitos" en una muestra, es aproximadamente la misma tanto si muestreamos de la población como si re-muestreamos de una muestra.

Hemos creado 1000 muestras aleatorias, cada una de tamaño 30, a partir de la población. El data frame resultante, all_polls, está disponible en tu espacio de trabajo. Échale un vistazo antes de empezar.

Este ejercicio forma parte del curso

Fundamentos de la inferencia en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Compute p-hat for each poll
ex1_props <- all_polls %>% 
  # Group by poll
  ___(___) %>% 
  # Calculate proportion of yes votes
  ___(stat = ___(___))
  
# Review the result
ex1_props
Editar y ejecutar código