1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 범주형 데이터 추론

Connected

연습 문제

p-값, 두 가지 방법

귀무분포에 도달하는 방법은 보통 두 가지가 있다는 것을 앞에서 보셨죠. 계산을 통한 방법과 수학적 근사입니다. 카이제곱 적합도 검정도 예외가 아닙니다. 근사 분포는 다시 자유도가 범주의 개수에서 1을 뺀 값인 "Chi-squared distribution"입니다.

이 연습 문제에서는 이 두 가지 접근을 비교하여, 이란의 첫 자리 숫자 분포가 벤퍼드 법칙과 얼마나 일치하는지를 나타내는 p-값을 계산해 보겠습니다. 지난 연습에서 만든 관측 통계량은 chi_obs_stat으로 작업 공간에 저장되어 있습니다.

지침 1/2

undefined XP
    1
    2
  • iran 데이터에서 first_digit 벡터를 가져와 nlevels() 함수로 범주의 개수를 구한 뒤 1을 빼서 카이제곱 근사의 자유도를 계산하세요.
  • null을 사용해 카이제곱 통계량의 분포를 밀도 그래프로 그리세요. 관측 통계량을 나타내는 세로선을 추가하고, 계산한 자유도의 카이제곱 근사 곡선을 파란색으로 겹쳐 그리세요.