1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 범주형 데이터 추론

Connected

연습 문제

귀무가설이 참일 때: 결정

이전 연습 문제에서 관측된 비율 차이는 귀무분포의 한가운데에 있었어요. 이번에는 p-값 대신 기각역(rejection region) 개념을 사용해, 귀무가설을 기각할지에 대해 형식적으로 결정해 보겠습니다.

기각역은 통계량의 값 중 귀무가설을 기각하게 만드는 구간을 말합니다. 양측 검정에서는 기각역이 두 개예요. 상위 기각역에는 귀무 통계량의 상위 2.5%가 포함되어야 하므로(alpha = 0.05일 때), .975 quantile()을 사용해 임계값을 구할 수 있습니다. 마찬가지로 하위 기각역에는 하위 2.5%가 포함되며, 이 역시 quantile()로 구할 수 있습니다.

다음은 간단한 데이터셋 x에 대해 quantile() 함수가 어떻게 동작하는지 빠르게 살펴본 예시입니다.

x <- c(0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20)
quantile(x, probs = .5)
quantile(x, probs = .8)

상한과 하한 임계값으로 기각역을 정의한 뒤에는, 관측된 통계량이 그 임계값 사이에 있는지(이 경우 귀무가설을 기각하지 않음) 또는 바깥에 있는지(이 경우 기각함)를 확인해 결정하면 됩니다.

지침 1/2

undefined XP
    1
    2
  • 값이 0.05인 객체 alpha를 만드세요.
  • 지난 연습 문제에서 가져온 null 데이터 프레임에서 시작해, stat 열의 alpha / 2 quantile()을 구해 요약하고 이를 lower에 저장하세요. 다음으로 1 - alpha / 2 quantile()을 구해 upper에 저장하세요.
  • 관측값 d_hat이 lower와 upper 임계값 사이에 between()으로 포함되는지 확인해, 귀무가설을 기각하지 않아야 하는지 판단하세요.