1. 学ぶ
  2. /
  3. コース
  4. /
  5. R에서의 추론 기초

Connected

演習

부트스트랩 퍼센타일 구간

이전 연습 문제의 핵심 아이디어는, 원래 표본의 $\hat{p}\(와 재표본(부트스트랩)으로 얻은 \)\hat{p}^*\( 값들의 거리로부터, 원래 \)\hat{p}$가 모비율의 실제 값에서 얼마나 떨어져 있는지를 가늠할 수 있다는 점이었어요.

같은 변동성을 다른 방식으로도 측정할 수 있어요. 앞서와 마찬가지로, $\hat{p}\(가 실제 모수에 충분히 가깝다면, 재표본(부트스트랩) \)\hat{p}^*$ 값들의 분포는 실제 모수와 겹치도록 변동할 거예요.

표본 \(\hat{p}\) 값들의 가운데 95%를 $\pm 2 SE\(로 측정하는 대신, 재표본 \)\hat{p}^*$ 값들에서 위쪽 2.5%와 아래쪽 2.5%를 제거해 가운데 구간을 찾을 수 있어요. 이 두 번째 부트스트랩 구간 구성 방법은 95%뿐 아니라 90%나 99% 신뢰구간을 만드는 데에도 직관적으로 확장할 수 있다는 점에 유의하세요.

부트스트랩 재표본 one_poll_boot와 찬성 비율 p_hat이 작업 공간에 준비되어 있어요.

指示1 / 3

undefined XP
  • 1
    • 코드를 실행해 이전 연습 문제의 t-구간을 다시 확인하세요.
    • one_poll_boot에 담긴 부트스트랩 \(\hat{p}^*\) 값의 95% 구간을 계산하세요.
      • p를 0.025로 설정해 stat의 2.5% 분위수에서 하한을 계산하세요.
      • 상한도 같은 방식으로 계산하세요.
  • 2

    infer의 편의 함수 get_confidence_interval()을 사용해 동일한 계산을 수행하세요. 구간 수준은 level = 0.95로 하고, 출력값의 이름은 percentile_ci로 지정하세요.

  • 3
    • 부트스트랩 비율 분포를 visualize()로 표시하고 가운데 95%를 강조하세요.
      • 강조할 영역의 endpoints를 percentile_ci로 설정하세요.
      • direction은 "between"으로 설정해 그 구간 사이를 강조하세요.