1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 살펴보는 표본추출(Sampling)

Connected

연습 문제

표본분포 vs. 부트스트랩 분포

표본분포와 부트스트랩 분포는 서로 밀접하게 연결되어 있습니다. 모집단에서 반복해서 표본을 추출할 수 있는 상황(드물긴 합니다)이라면, 두 분포를 순서대로 생성해 보며 서로 어떻게 연관되는지 확인하는 것이 도움이 됩니다.

여기서 관심 있는 통계량은 노래의 popularity 평균 점수입니다.

전체 데이터셋인 spotify_population과, 그중에서 무작위로 500행을 추출한 spotify_sample이 준비되어 있습니다. 또한 pandas와 numpy는 평소와 같은 별칭으로 불러와져 있습니다.

지침 1/2

undefined XP
  • 1
    • for 반복문을 사용해 2000개의 복제본으로 구성된 표본분포를 생성하세요.
    • 모집단에서 복원 추출 없이 500행을 추출하고 popularity의 평균을 계산하세요.
  • 2
    • 표본에서 복원 추출로 500행을 추출하고 popularity의 평균을 계산하여 2000개의 복제본으로 구성된 부트스트랩 분포를 생성하세요.