1. Apprendre
  2. /
  3. Cours
  4. /
  5. Échantillonnage en Python

Connected

Exercice

L'échantillonnage systématique convient-il?

L'échantillonnage systématique pose un problème : si les données ont été triées, ou si l'ordre des lignes suit un certain motif ou a une signification, l'échantillon obtenu pourrait ne pas être représentatif de l'ensemble de la population. On peut régler le problème en mélangeant les lignes, mais dans ce cas, l'échantillonnage systématique devient équivalent à un échantillonnage aléatoire simple.

Ici, vous allez voir comment déterminer s'il y a un problème ou non.

attrition_pop est disponible; pandas est chargé sous le nom pd, et matplotlib.pyplot sous plt.

Instructions 1/3

undefined XP
    1
    2
    3
  • Ajoutez une colonne d'index à attrition_pop et assignez le résultat à attrition_pop_id.
  • Créez un nuage de points de YearsAtCompany en fonction de index pour attrition_pop_id à l'aide de .plot() de pandas.