1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 배우는 추론 통계 기초

Connected

연습 문제

순열 검정으로 비대칭 분포 데이터 분석하기

순열 검정은 이미 알고 있는 가설검정의 조건을 만족하지 못하는 상황에서 유용합니다. 이번 연습 문제에서는 statsmodels 패키지를 사용해 순열 검정을 직접 구현해 보겠습니다.

관심사는 analytics 분야 기업과 기타 벤처 투자 기업 간의 평균 투자 라운드 수를 비교하는 것입니다. t-검정을 쓰고 싶을 수 있지만, 투자 라운드 수는 정규분포를 따르지 않는다고 확신할 수 있습니다. 실제로 대부분의 기업은 라운드가 1회에 그치고, 2회 이상인 기업 수는 급격히 줄어듭니다.

다음 데이터가 미리 로드되어 있습니다:

  • analytics_df - 모든 analytics 기업 데이터
  • non_analytics_df - 기타 비-analytics 기업 데이터

지침

100 XP
  • 두 표본 fundings_group_1, fundings_group_2가 주어졌을 때 funding_rounds의 평균 차이를 반환하는 통계량 함수를 정의하세요.
  • 각 데이터 세트의 funding_rounds 열, 방금 정의한 통계량 함수, 그리고 재표본 100회를 사용해 순열 검정을 수행하세요.
  • 순열 검정의 p-값을 출력하세요.