1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

연습 문제

가설 검정: 2012년에 부리가 더 깊어졌나요?

ECDF 그래프와 신뢰 구간 계산 결과를 보면, Daphne Major의 G. scandens 부리 깊이가 더 깊어졌다는 점이 꽤 분명해 보입니다. 하지만 이 효과가 단순히 우연일 가능성은 없을까요? 다시 말해, 두 집단의 평균이 같다고 가정했을 때 지금처럼 관측된 평균 차이를 얻을 확률은 얼마인가요?

주의하세요! 여기서 검정하는 가설은 두 분포가 동일하다는 것이 아닙니다. 그 경우에는 순열 검정을 사용할 수 있습니다. 우리가 검정하는 가설은 두 평균이 같다는 것입니다. 이 가설 검정을 수행하려면, 두 데이터 세트의 평균을 동일하게 맞추도록 이동(shifting)한 다음, 부트스트랩 샘플링으로 평균 차이를 계산해야 합니다.

지침

100 XP
  • 1975년과 2012년 부리 깊이를 하나의 배열로 이어 붙이고, 그 평균을 계산해 저장하세요.
  • 방금 결합 데이터셋에 대해 계산한 평균과 같아지도록 bd_1975와 bd_2012의 평균을 맞추어 이동시키세요.
  • 1975년과 2012년 부리 깊이에 대해 각각 평균의 부트스트랩 복제를 10,000번 생성하세요.
  • 2012년의 복제값에서 1975년의 복제값을 빼서 차이의 부트스트랩 복제를 얻으세요.
  • p-값을 계산해 출력하세요. 지난 연습에서 계산한 관측 평균 차이는 여전히 네임스페이스에 mean_diff로 있습니다.