Muestreo aleatorio simple

El método más sencillo para muestrear una población es el que ya has visto. Se conoce como muestreo aleatorio simple (a veces abreviado como «SRS») y consiste en seleccionar filas al azar, una a una, de forma que todas tengan la misma probabilidad de ser elegidas.

Para facilitar ver qué filas terminan en la muestra, es útil incluir una columna de ID de fila en el conjunto de datos antes de extraer la muestra.

En este capítulo, veremos métodos de muestreo usando un conjunto de datos sintético (ficticio) de rotación de empleados de IBM, donde «rotación» significa dejar la empresa.

attrition_pop está disponible; dplyr está cargado.

Este ejercicio forma parte del curso

Muestreo en R

Ver curso

Instrucciones del ejercicio

Visualiza el conjunto de datos attrition_pop. Explóralo en el visor hasta tener claro qué contiene.
Fija la semilla aleatoria con el valor que elijas.
Añade una columna de ID de fila al conjunto de datos y luego usa muestreo aleatorio simple para obtener 200 filas.
Visualiza el conjunto de datos de la muestra, attrition_samp. ¿Qué observas en los ID de fila?

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# View the attrition_pop dataset
___

# Set the seed
___

attrition_samp <- attrition_pop %>% 
  # Add a row ID column
  ___ %>% 
  # Get 200 rows using simple random sampling
  ___

# View the attrition_samp dataset
___

Editar y ejecutar código