1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. R에서의 추론 기초

Connected

Exercises

표본에서의 재표집

모집단 비율의 추정값이 표본마다 얼마나 달라지는지 알아보기 위해 두 가지 표집 실험을 설정해 보겠습니다.

첫 번째 실험에서는 모집단에서 반복적으로 표본을 추출해 보겠습니다. 두 번째 실험에서는 첫 번째 실험에서 얻은 하나의 표본을 선택해 그 표본에서 반복적으로 재표집하는데, 이를 부트스트래핑(bootstrapping)이라고 합니다. 구체적으로는 다음과 같습니다.

실험 1: 후보 X에게 투표할 사람의 실제 비율이 0.6이라고 가정합니다. 모집단에서 사람 30명을 반복적으로 표집하고, \(\hat{p}\)(표본 비율)의 변동성을 측정하세요.

실험 2: 같은 모집단에서 크기 30의 표본 하나를 추출합니다. 원래 표본에서 복원추출로 사람 30명을 반복적으로 재표집하고, \(\hat{p}^*\)(재표집 비율)의 변동성을 측정하세요.

중요한 점은 첫 번째 실험은 모집단을 알고 있어야 하므로 실제로는 보통 불가능하다는 것입니다. 반면 두 번째 실험은 표본 데이터만 있으면 되므로 어떤 통계량에도 쉽게 적용할 수 있습니다. 다행히 보시게 되겠지만, 표본에서의 "성공" 비율인 $\hat{p}$의 변동성은 모집단에서 직접 표집하든 표본에서 재표집하든 거의 비슷합니다.

우리는 모집단에서 크기 30의 무작위 표본 1000개를 만들어 두었습니다. 그 결과가 담긴 데이터 프레임 all_polls가 작업 공간에 준비되어 있습니다. 시작하기 전에 한 번 살펴보세요.

คำแนะนำ 1 / 3

undefined XP
    1
    2
    3
  • 1000개의 원래 표본 각각에 대한 표본 비율을 계산해 ex1_props에 할당하세요.
    • poll로 그룹화합니다.
    • vote가 "yes"인 경우의 mean()을 계산해 stat으로 요약하세요.