1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 가설 검정

Connected

연습 문제

신뢰 구간 계산하기

표본 통계량을 하나의 값으로만 추정하면, 어느 정도의 오차는 피하기 어렵습니다. 예를 들어, 지연 배송 비율의 귀무가설 값이 6%라고 가정해 보죠. 지연 배송 비율이 이 값과 같다는 귀무가설을 지지하는 증거가 있더라도, 새로운 표본을 뽑을 때마다 표본추출 변동성 때문에 비율은 조금씩 달라질 가능성이 큽니다. 따라서 신뢰 구간을 함께 제시하는 것이 좋습니다. 즉, "지연 배송 비율이 A와 B 사이에 있을 것이라고 95% '신뢰'합니다"라고 말하는 방식입니다(A와 B는 어떤 값).

Sampling in Python에서는 신뢰 구간을 계산하는 두 가지 방법을 보여드렸습니다. 여기서는 부트스트랩 분포의 분위수를 사용해 신뢰 구간을 계산하겠습니다.

late_prop_samp와 late_shipments_boot_distn이 준비되어 있고, pandas와 numpy는 일반적인 별칭으로 로드되어 있습니다.

지침 1/2

undefined XP
    1
    2
  • 분위수 방법을 사용해 late_shipments_boot_distn에서 95% 신뢰 구간을 계산하고, 하한과 상한을 각각 lower와 upper로 레이블하세요.