Échantillonnage stratifié à dénombrements égaux
Si un sous-groupe est plus grand qu’un autre dans la population, mais que vous ne souhaitez pas refléter cette différence dans votre analyse, vous pouvez utiliser l’échantillonnage stratifié à dénombrements égaux pour générer des échantillons dans lesquels chaque sous-groupe dispose de la même quantité de données. Par exemple, si vous analysez les groupes sanguins, O est le groupe sanguin le plus répandu dans le monde, mais vous pouvez souhaiter avoir des quantités égales de O, A, B et AB dans votre échantillon.
attrition_pop
est disponible. pandas
est chargé avec son alias habituel.
Cet exercice fait partie du cours
L’échantillonnage en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get 30 employees from each Education group
attrition_eq = ____
# Print the sample
print(attrition_eq)