Muestreo aleatorio simple
El método más sencillo para muestrear una población es el que ya has visto. Se conoce como muestreo aleatorio simple (a veces abreviado como «SRS») y consiste en seleccionar filas al azar, una a una, de forma que todas tengan la misma probabilidad de ser elegidas.
Para facilitar ver qué filas terminan en la muestra, es útil incluir una columna de ID de fila en el conjunto de datos antes de extraer la muestra.
En este capítulo, veremos métodos de muestreo usando un conjunto de datos sintético (ficticio) de rotación de empleados de IBM, donde «rotación» significa dejar la empresa.
attrition_pop está disponible; dplyr está cargado.
Este ejercicio forma parte del curso
Muestreo en R
Instrucciones del ejercicio
- Visualiza el conjunto de datos
attrition_pop. Explóralo en el visor hasta tener claro qué contiene. - Fija la semilla aleatoria con el valor que elijas.
- Añade una columna de ID de fila al conjunto de datos y luego usa muestreo aleatorio simple para obtener 200 filas.
- Visualiza el conjunto de datos de la muestra,
attrition_samp. ¿Qué observas en los ID de fila?
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# View the attrition_pop dataset
___
# Set the seed
___
attrition_samp <- attrition_pop %>%
# Add a row ID column
___ %>%
# Get 200 rows using simple random sampling
___
# View the attrition_samp dataset
___