1. 학습
  2. /
  3. 강의
  4. /
  5. R에서의 추론 기초

Connected

연습 문제

성차별 무작위화하기

남성과 여성의 수가 고정되어 있고(이력서를 나타냄), 승진한 사람의 수도 고정되어 있는(관리자는 35명만 승진시킬 수 있었음) 상황을 다루고 있음을 기억하세요.

이번 연습에서는 이전 연습에서의 5회가 아닌, 1000회의 복제를 사용해 귀무통계량의 무작위화 분포를 생성해 볼 거예요. 참고로, 관심 있는 통계량은 성별 간 승진 비율의 차이(즉, 남성 비율에서 여성 비율을 뺀 값)입니다. 원래 데이터셋에서 남성과 여성의 승진률이 얼마나 다른지 계산할 수 있어요. infer의 specify-hypothesis-generate-calculate 워크플로를 사용하면 동일한 통계량을 계산하되, 하나의 숫자 대신 전체 분포를 얻을 수 있습니다. 이번 연습에서는 원래 데이터셋에서 계산한 단일 값과 시뮬레이션으로 만든 분포를 비교해 볼 거예요.

지침 1/3

undefined XP
    1
    2
    3
  • 관측된 승진률 차이를 계산하세요.
    • sex로 그룹화합니다.
    • 각 성별의 승진 비율을 promote == "promoted"의 mean()으로 요약해 계산하세요. 요약 변수 이름은 prop_prom으로 하세요.
    • 다시 요약하여 성별 간 비율 차이를 계산하고, prop_prom의 diff()를 stat으로 설정하세요.