성차별 무작위화하기

남성과 여성의 수가 고정되어 있고(이력서를 나타냄), 승진한 사람의 수도 고정되어 있는(관리자는 35명만 승진시킬 수 있었음) 상황을 다루고 있음을 기억하세요.

이번 연습에서는 이전 연습에서의 5회가 아닌, 1000회의 복제를 사용해 귀무통계량의 무작위화 분포를 생성해 볼 거예요. 참고로, 관심 있는 통계량은 성별 간 승진 비율의 차이(즉, 남성 비율에서 여성 비율을 뺀 값)입니다. 원래 데이터셋에서 남성과 여성의 승진률이 얼마나 다른지 계산할 수 있어요. infer의 specify-hypothesis-generate-calculate 워크플로를 사용하면 동일한 통계량을 계산하되, 하나의 숫자 대신 전체 분포를 얻을 수 있습니다. 이번 연습에서는 원래 데이터셋에서 계산한 단일 값과 시뮬레이션으로 만든 분포를 비교해 볼 거예요.