1. Learn
  2. /
  3. 课程
  4. /
  5. Python 抽样

Connected

道练习

3 种抽样方法

您将比较简单随机抽样、分层抽样和整群抽样在点估计上的表现。在此之前,您需要先准备样本。

您将使用 attrition_pop 数据集中的 RelationshipSatisfaction 列,它表示员工对公司的满意度分级。该变量共有 4 个水平:Low、Medium、High 和 Very_High。已按常用别名加载 pandas,并已加载 random 包。

说明 1/3

undefined XP
  • 1
    • 在 attrition_pop 上执行简单随机抽样,抽取四分之一的总体,将随机种子设为 2022。
  • 2
    • 在 attrition_pop 上执行分层抽样,对每个 RelationshipSatisfaction 分组抽取四分之一,将随机种子设为 2022。
  • 3
    • 从 attrition_pop 的 RelationshipSatisfaction 列创建唯一值列表。
    • 随机从 satisfaction_unique 中抽取 2 个值。
    • 将总体子集化为 RelationshipSatisfaction 属于 satisfaction_samp 的行,并清理 RelationshipSatisfaction 中未使用的类别;赋值给 attrition_clust_prep。
    • 在选定的满意度分组上执行整群抽样,按总体的四分之一进行抽样,并将随机种子设为 2022。