무작위화 분포에서 표본 크기

원래 차별 데이터와 사실상 동일한 비율 차이를 갖는 두 개의 새 데이터셋을 준비했어요. 다만 한 데이터셋(disc_small)은 원본의 3분의 1 크기이고, 다른 데이터셋(disc_big)은 원본보다 10배 큽니다.

또한 이전에 사용한 동일한 순열 코드를 작은 데이터셋과 큰 데이터셋에도 적용하여, 승진 비율 차이의 순열 분포(disc_small_perm과 disc_big_perm)를 각각 얻어 두었습니다.

이번 연습에서는 이 두 분포를 사용해 표본 크기가 크게 다른 경우 차이가 어떻게 달라지는지 감을 잡아 보겠습니다. 특히 각 그림의 x축에서 변동 범위를 눈여겨봐 주세요.