Échantillonnage aléatoire simple
La méthode la plus simple d’échantillonnage d’une population est celle que vous avez déjà vue. Il s’agit de l’échantillonnage aléatoire simple (parfois abrégé en « EAS »), qui consiste à choisir des lignes aléatoirement, une à la fois, chaque ligne ayant la même probabilité d’être choisie qu’une autre.
Dans ce chapitre, vous appliquerez des méthodes d’échantillonnage à un ensemble de données synthétiques (fictives) sur l’attrition des employés IBM, où le terme « attrition » signifie dans ce contexte que l’employé a quitté l’entreprise.
attrition_pop
est disponible. pandas
est chargé en tant que pd
.
Cet exercice fait partie du cours
L’échantillonnage en Python
Instructions
- Échantillonnez 70 lignes de
attrition_pop
à l’aide d’un échantillonnage aléatoire simple, en définissant la graine aléatoire sur18900217
. - Imprimez l’échantillon de données,
attrition_samp
. Que remarquez-vous à propos des indices ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Sample 70 rows using simple random sampling and set the seed
attrition_samp = ____
# Print the sample
____