CommencerCommencer gratuitement

L’échantillonnage systématique convient-il ?

L’échantillonnage systématique présente un problème : si les données ont été triées, ou si l’ordre des lignes présente un certain schéma ou une certaine signification, l’échantillon obtenu peut ne pas être représentatif de l’ensemble de la population. Le problème peut être résolu en mélangeant les lignes, mais l’échantillonnage systématique est alors équivalent à l’échantillonnage aléatoire simple.

Vous verrez ici comment déterminer s’il y a ou non un problème.

attrition_pop est disponible. pandas est chargé en tant que pd et matplotlib.pyplot en tant que plt.

Cet exercice fait partie du cours

L’échantillonnage en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Add an index column to attrition_pop
attrition_pop_id = ____

# Plot YearsAtCompany vs. index for attrition_pop_id
____
plt.show()
Modifier et exécuter le code