1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 A/B Testing

Connected

연습 문제

비율을 위한 표본 크기

실제 데이터셋은 종종 지저분해요. 실제 환경에서 데이터를 다루는 Analytics Engineer로 일하다 보면, 데이터의 분산이 너무 커서 지표의 의미 있는 차이를 포착하기 어려운 상황을 마주하게 됩니다. 이런 문제는 앞 연습 문제의 평균 주문 금액처럼 연속형 지표에서 더 자주 발생해요. 이를 해결하는 방법은 여러 가지가 있지만, 그중 하나는 분산이 더 낮으면서도 비즈니스 목표와 정렬되는 대체 지표를 찾는 것입니다.

여기서는 이진 지표의 표본 크기를 계산해 보겠습니다. 유료 결제 금액처럼 사용자 간 차이가 큰 값 대신, 사용자가 서비스에 가입했는지 여부를 나타내는 가입률(signup rate)을 사용할 거예요. homepage DataFrame과 pandas, numpy 라이브러리는 이미 로드되어 있으며, statsmodels.stats.proportion의 proportion_effectsize와 statsmodels.stats의 power도 함께 제공됩니다.

지침 1/3

undefined XP
    1
    2
    3
  • landing_page가 'A'인 경우의 signup 비율을 계산하세요.