1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 살펴보는 표본추출(Sampling)

Connected

연습 문제

샘플링의 3가지 방법

이제 단순, 층화, 군집 샘플링을 사용해 점추정치의 성능을 비교해 보겠습니다. 그 전에 먼저 샘플을 준비해야 해요.

직원의 회사와의 관계를 범주형으로 나타내는 attrition_pop 데이터셋의 RelationshipSatisfaction 열을 사용합니다. 수준은 Low, Medium, High, Very_High의 네 가지예요. pandas는 일반적인 별칭으로 로드되어 있고, random 패키지도 로드되어 있습니다.

지침 1/3

undefined XP
  • 1
    • attrition_pop에 대해 단순 임의 추출을 수행하여 모집단의 4분의 1을 얻고, 시드를 2022로 설정하세요.
  • 2
    • attrition_pop에서 RelationshipSatisfaction의 각 그룹마다 4분의 1을 추출하는 층화 샘플링을 수행하고, 시드를 2022로 설정하세요.
  • 3
    • attrition_pop의 RelationshipSatisfaction 열에서 고유 값을 리스트로 만드세요.
    • satisfaction_unique에서 무작위로 두 값을 샘플링하세요.
    • RelationshipSatisfaction이 satisfaction_samp에 포함된 행만 남기고, RelationshipSatisfaction의 사용하지 않는 범주는 정리한 뒤 모집단을 부분집합으로 만들어 attrition_clust_prep에 할당하세요.
    • 선택된 만족도 그룹에 대해 군집 샘플링을 수행하되, 시드를 2022로 설정하고 모집단의 4분의 1을 샘플링하세요.