1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 추론 기초

Connected

연습 문제

p-value 계산하기

영상에서 p-value는 데이터와 귀무가설 사이의 불일치 정도를 나타낸다는 것을 배웠습니다. 여기서는 원래의 차별 데이터뿐만 아니라 그 축소/확장 버전인 disc_small와 disc_big에 대해서도 p-value를 계산해 보겠습니다.

비율 차이의 원래 관측값은 작업 공간에 diff_orig, diff_orig_small, diff_orig_big으로 준비되어 있고, 순열로 생성한 데이터셋도 disc_perm, disc_perm_small, disc_perm_big으로 제공되어 있습니다.

여기서는 단측 가설검정에만 관심이 있다는 점을 기억하세요. 즉, "남성이 여성보다 승진할 가능성이 더 높은가요?"라는 질문에 답하려는 것입니다.

지침

100 XP
  • 내장 infer 함수를 사용해 visualize()와 get_p_value()를 실행하세요. 귀무통계량이 원래 차이보다 작은 쪽에 있으므로, p-value(귀무값이 원래 관측값보다 얼마나 더 ‘극단적인지’의 빈도)는 원래 차이보다 greater(큰) 귀무값의 개수를 세어 계산합니다.
  • 관측된 차이가 diff_orig_small인 작은 데이터셋 disc_perm_small에 대해 반복하세요.
  • 관측된 차이가 diff_orig_big인 큰 데이터셋 disc_perm_big에 대해 반복하세요.
  • 답변을 제출하기 전에 direction = "greater", direction = "two_sided", direction = "less"를 번갈아 써 보며 개념을 점검해 보세요.