A amostragem sistemática é OK?
A amostragem sistemática tem um problema: se os dados tiverem sido classificados, ou se houver algum tipo de padrão ou significado por trás da ordem das linhas, a amostra resultante poderá não ser representativa de toda a população. O problema pode ser resolvido embaralhando as linhas, mas, nesse caso, a amostragem sistemática é equivalente à amostragem aleatória simples.
Aqui você verá como determinar se há ou não um problema.
attrition_pop
Você pode acessar pandas
como pd
, e matplotlib.pyplot
como plt
.
Este exercício faz parte do curso
Amostragem em Python
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Add an index column to attrition_pop
attrition_pop_id = ____
# Plot YearsAtCompany vs. index for attrition_pop_id
____
plt.show()