1. Apprendre
  2. /
  3. Cours
  4. /
  5. Échantillonnage en Python

Connected

Exercice

3 types d'échantillonnage

Vous allez comparer la performance des estimations ponctuelles en utilisant un échantillonnage aléatoire simple, stratifié et par grappes. Avant cela, vous devrez préparer les échantillons.

Vous utiliserez la colonne RelationshipSatisfaction du jeu de données attrition_pop, qui catégorise la relation de l'employé avec l'entreprise. Elle comporte quatre niveaux : Low, Medium, High et Very_High. pandas a été importé avec son alias habituel, et le module random a été chargé.

Instructions 1/3

undefined XP
  • 1
    • Effectuez un échantillonnage aléatoire simple sur attrition_pop pour obtenir un quart de la population, en fixant la graine à 2022.
  • 2
    • Effectuez un échantillonnage stratifié sur attrition_pop pour prélever un quart de chaque groupe RelationshipSatisfaction, en fixant la graine à 2022.
  • 3
    • Créez une liste de valeurs uniques à partir de la colonne RelationshipSatisfaction de attrition_pop.
    • Échantillonnez aléatoirement satisfaction_unique pour obtenir deux valeurs.
    • Sous-échantillonnez la population pour les lignes où RelationshipSatisfaction est dans satisfaction_samp et retirez toute catégorie inutilisée de RelationshipSatisfaction ; affectez le résultat à attrition_clust_prep.
    • Effectuez un échantillonnage par grappes sur les groupes de satisfaction sélectionnés, en prélevant un quart de la population et en fixant la graine à 2022.