A amostragem sistemática é adequada?
A amostragem sistemática tem um problema: se os dados tiverem sido ordenados, ou se houver algum tipo de padrão ou significado por trás da ordem das linhas, a amostra resultante pode não ser representativa de toda a população. O problema pode ser resolvido embaralhando as linhas, mas aí a amostragem sistemática fica equivalente à amostragem aleatória simples.
Aqui você vai ver como determinar se existe ou não esse problema.
attrition_sys_samp está disponível e recebeu uma coluna de ID de linha; dplyr e ggplot2 estão carregados.
Este exercício faz parte do curso
Amostragem em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>%
rowid_to_column()
# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
# Make it a scatter plot
___ +
# Add a smooth trend line
___