1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 범주형 데이터 추론

Connected

연습 문제

적합도 검정

적합도 검정에서의 영가설은 각 비율에 대한 구체적인 모수 값 목록입니다. 이번 분석에서 동등한 가설은 베프스 법칙(Benford's Law)이 시 단위 총 득표수의 첫 자리 분포에 적용된다는 것입니다. 이는 다음과 같이 쓸 수 있어요:

$$ H_0: p_1 = .30, p_2 = .18, \ldots, p_9 = .05 $$

여기서 $p_1$은 Benford 막대그래프에서 첫 번째 막대의 높이를 뜻합니다. 대립가설은 이 비율들 중 적어도 하나가 다르다는 것으로, 첫 자리 분포가 Benford's Law를 따르지 않는다는 뜻이에요.

이번 연습에서는, 실제로 이 집계가 Benford's Law를 따른다고 가정했을 때 관찰될 수 있는 카이제곱 통계량의 영가설 분포를 시뮬레이션으로 구축해 볼 거예요.

지침

100 XP
  • p_benford를 화면에 출력해 살펴보세요.
  • iran부터 시작해서, chisq_stat을 사용해 카이제곱 통계량을 계산하세요. 데이터 프레임에서 반응으로 사용할 변수와 비교할 확률 벡터를 모두 지정해야 한다는 점에 유의하세요.
  • point 영가설 하에서 비율 벡터 p가 p_benford라고 가정하고 시뮬레이션으로 Chisq 통계량 500개를 생성해 영가설 분포를 구성하세요. 계산된 통계량은 null에 저장하세요.