1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

연습 문제

웹사이트 체류 시간에 대한 유사 사례

사실, 광고 캠페인 전후로 웹사이트에서 머문 시간의 변화를 보고자 하는 A/B 테스트와 유사한 가설 검정을 이미 수행하셨습니다. 개구리 혀의 힘(웹사이트 체류 시간처럼 연속형 변수)이 그 유사 사례였죠. "이전" = 개구리 A, "이후" = 개구리 B로 볼 수 있습니다. 이번에는 실제로 이전/이후가 있는 시나리오로 다시 연습해 보겠습니다.

다시 무안타(no-hitter) 데이터셋으로 돌아가 보겠습니다. 1920년에 메이저리그 베이스볼은 이른바 데드볼 시대를 끝내는 중요한 규정을 도입했습니다. 특히 투수는 공에 침을 뱉거나 흠집을 내는 행위를 할 수 없게 되었는데, 이는 투수에게 큰 이점을 주던 행동이었습니다. 이 문제에서는 이러한 규정 변경이 무안타 발생률을 낮추었는지(즉, 무안타 사이의 평균 시간이 더 길어졌는지)를 평균 무노히터 간격 차이를 검정 통계량으로 사용해 A/B 테스트로 판단합니다. 각 시대의 무노히터 간격은 배열 nht_dead와 nht_live에 저장되어 있으며, 여기서 "nht"는 "no-hitter time"을 의미합니다.

이 연습 문제에서는 draw_perm_reps() 함수를 사용할 것이므로, 함수 시그니처 draw_perm_reps(d1, d2, func, size=1)를 다시 떠올리거나, 해당 함수를 정의했던 챕터 3의 연습 문제를 다시 참고하셔도 좋습니다.

지침

100 XP
  • diff_of_means()를 사용해 관측된 평균 무노히터 간격 차이를 계산하세요.
  • draw_perm_reps()로 평균 차이의 순열 복제 10,000개를 생성하세요.
  • p-값을 계산해 출력하세요.