¿Está bien el muestreo sistemático?
El muestreo sistemático tiene un problema: si los datos se han ordenado o hay algún tipo de patrón o significado detrás del orden de las filas, la muestra resultante puede no ser representativa de toda la población. El problema se puede resolver barajando las filas, pero entonces el muestreo sistemático equivale al muestreo aleatorio simple.
Aquí verás cómo determinar si hay un problema o no.
attrition_sys_samp está disponible y se le ha añadido una columna de ID de fila; dplyr y ggplot2 están cargados.
Este ejercicio forma parte del curso
Muestreo en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>%
rowid_to_column()
# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
# Make it a scatter plot
___ +
# Add a smooth trend line
___