1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 통계적 사고 (2부)

Connected

연습 문제

피어슨 상관에 대한 가설 검정

여성 문해율과 출산율 사이에서 관찰된 상관관계는 우연일 수도 있습니다. 즉, 어떤 나라의 출산율이 문해율과 완전히 독립적일 가능성도 있죠. 이 가설을 검정해 보겠습니다. 이를 위해 문해율(illiteracy) 값은 섞되, 출산율(fertility) 값은 고정하세요. 이렇게 하면 두 변수가 서로 완전히 독립적이라는 귀무가설을 모의실험할 수 있습니다. 각 순열마다 피어슨 상관계수를 계산하고, 관찰된 상관계수보다 큰 피어슨 상관계수를 갖는 순열 복제값이 몇 개인지 확인하세요.

피어슨 상관계수를 계산하는 함수 pearson_r()는 이미 제공되어 있습니다. 이 함수는 이 강의 전편에서 직접 작성했던 함수입니다.

지침

100 XP
  • illiteracy와 fertility 사이의 관찰된 피어슨 상관계수를 계산하세요.
  • 순열 복제값을 저장할 배열을 초기화하세요.
  • for 루프를 작성해 10,000개의 복제값을 생성하세요:
    • np.random.permutation()을 사용해 illiteracy 측정값을 섞으세요.
    • 섞인 문해율 배열 illiteracy_permuted와 fertility 사이의 피어슨 상관계수를 계산하세요.
  • 복제값으로부터 p-값을 계산해 출력하세요.