ComeçarComece de graça

A amostragem sistemática é adequada?

A amostragem sistemática tem um problema: se os dados tiverem sido ordenados, ou se houver algum tipo de padrão ou significado por trás da ordem das linhas, a amostra resultante pode não ser representativa de toda a população. O problema pode ser resolvido embaralhando as linhas, mas aí a amostragem sistemática fica equivalente à amostragem aleatória simples.

Aqui você vai ver como determinar se existe ou não esse problema.

attrition_sys_samp está disponível e recebeu uma coluna de ID de linha; dplyr e ggplot2 estão carregados.

Este exercício faz parte do curso

Amostragem em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>% 
  rowid_to_column()

# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
  # Make it a scatter plot
  ___ +
  # Add a smooth trend line
  ___
Editar e executar o código