1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 선형 모델 입문

Connected

연습 문제

P-값 시각화하기

이번 연습에서는 p-값을 시각화해 볼 거예요. p-값은 우리가 추정한 효과(또는 "속도")가 표본의 무작위 변동으로 인해 나타났을 가능성을 의미해요. 무작위로 섞지 않은 표본에서 계산한 검정 통계량의 평균("효과 크기")의 오른쪽에 위치하는, 섞인 검정 통계량 분포의 점들이 차지하는 비율로 이를 시각화하는 것이 목표예요.

시작할 수 있도록, group_duration_short와 group_duration_long, 그리고 함수 compute_test_statistic(), shuffle_and_split(), plot_test_statistic_effect()를 미리 불러왔어요.

지침

100 XP
  • compute_test_statistic()을(를) 사용해 group_duration_short와 group_duration_long에서 test_statistic_unshuffled를 구한 다음, np.mean()으로 효과 크기(effect size)를 계산하세요.
  • shuffle_and_split()을(를) 사용해 shuffle_half1와 shuffle_half2를 만들고, compute_test_statistic()으로 test_statistic_shuffled를 계산하세요.
  • 불리언 마스크 condition을 만들어 test_statistic_shuffled 값이 effect_size보다 크거나 같도록 지정한 뒤, 이 마스크를 사용해 p_value를 계산하세요.
  • p_value를 출력하고 plot_test_statistic_effect()으로 두 검정 통계량을 모두 그리세요.