1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶサンプリング

Connected

演習

等カウントの層別抽出

母集団の中であるサブグループが別のサブグループより大きくても、その差を分析に反映させたくない場合は、等カウントの層別抽出 を使って、各サブグループのデータ量が同じになるようにサンプルを作成できます。たとえば血液型を分析する場合、世界ではO型が最も多いですが、サンプルでは O、A、B、AB を同じ数だけ含めたいことがあります。

attrition_pop が利用可能です。pandas は通常のエイリアスで読み込まれています。

指示1 / 2

undefined XP
    1
    2
  • attrition_pop に対して等カウントの層別抽出を行い、各 Education グループから 30 名の従業員を取得し、乱数シードを 2022 に設定します。