1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 선형 모델 입문

Connected

연습 문제

검정 통계량 시각화하기

이 연습 문제에서는 두 가지 서로 다른 방식으로 얻은 검정 통계량의 분포를 비교하여 영가설에 접근해 보겠습니다.

먼저, 이른 시간대와 늦은 시간대로 묶인 두 "모집단"을 살펴보고 검정 통계량 분포를 계산합니다. 다음으로, 두 모집단을 섞어서 데이터의 시간 순서를 없애고 각 집단에 이른/늦은 시간이 혼합되도록 한 뒤, 검정 통계량 분포를 다시 계산합니다.

시작할 수 있도록, 두 시간 구간 그룹 group_duration_short와 group_duration_long, 그리고 두 함수 shuffle_and_split()과 plot_test_statistic()을 미리 로드해 두었습니다.

지침

100 XP
  • np.random.choice()를 사용해 group_duration_short와 group_duration_long을 리샘플링하고, 두 리샘플의 차이를 내어 test_statistic_unshuffled를 계산하세요.
  • 원본 group_duration_short와 group_duration_long에 대해 이 순서로 shuffle_and_split()을 사용해 두 개의 새로운 혼합 모집단을 만드세요.
  • 섞인 모집단을 리샘플링하고, resample_long에서 resample_short를 빼서 새로운 test_statistic_shuffled를 계산하세요.
  • plot_test_statistic()을 사용해 두 검정 통계량 분포를 모두 그려 보고 시각적으로 비교하세요.