부트스트랩 t-신뢰구간

이전 연습 문제에서 두 가지를 확인했어요:

원본 표본에서 재표집(resampling)하면 $\hat{p}$에 관한 변동성을 측정할 수 있어요.
$\hat{p}$의 변동성을 알게 되면, 이를 사용해 실제 모수가 얼마나 떨어져 있는지를 측정할 수 있어요.

여기서 근접률 (여기서는 95%)은 모집단 모수에 가깝도록 선택되는 표본의 비율을 의미합니다. 특정 데이터셋이 모수에 가까운지 먼지는 알 수 없지만, 평생 수집하는 표본 가운데 95%는 실제 모집단 모수로부터 $2SE$ 이내의 추정치를 줄 것이라는 사실은 알고 있어요.

단일 여론조사의 투표 결과 one_poll과 1000개의 부트스트랩 재표집에서 나온 데이터 one_poll_boot가 작업 공간에 준비되어 있습니다. 이들은 이 장 앞부분의 실험 2를 바탕으로 합니다.

이전 연습 문제와 마찬가지로, 통계량의 변동성을 논할 때 그 수치를 표준 오차(standard error)라고 부릅니다.

$\hat{p}$를 계산해 p_hat에 할당하세요. summarize() 호출에서 stat는 vote가 "yes"와 같은지의 평균으로 계산하세요.
$\hat{p} \pm 2SE$를 계산해 실제 모수에 대해 그럴듯한 값들의 구간을 찾으세요.
- 신뢰구간의 lower 경계는 p_hat에서 stat의 표준 오차의 두 배를 뺀 값입니다. 표준 오차는 sd()로 계산하세요.
- upper 경계는 p_hat에 stat의 표준 오차의 두 배를 더한 값입니다.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제

지침

연습 문제