Aleatorizando discriminação de gênero
Lembre que estamos considerando uma situação em que o número de homens e mulheres é fixo (representando os currículos) e o número de pessoas promovidas também é fixo (os gerentes puderam promover apenas 35 pessoas).
Neste exercício, você vai criar uma distribuição de aleatorização da estatística nula com 1000 réplicas, em vez de apenas 5 como no exercício anterior. Reforçando: a estatística de interesse é a diferença entre as proporções de promoção entre os gêneros (isto é, proporção para homens menos proporção para mulheres). A partir do conjunto de dados original, você pode calcular como as taxas de promoção diferem entre homens e mulheres. Usando o fluxo de trabalho especificar-hipótese-gerar-calcular do infer, você pode calcular a mesma estatística, mas, em vez de obter um único número, você obtém uma distribuição inteira. Neste exercício, você vai comparar aquele número único do conjunto de dados original com a distribuição gerada pela simulação.
Este exercício faz parte do curso
Fundamentos de Inferência em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
# Group by sex
group_by(___) %>%
# Summarize to calculate fraction promoted
___(prop_prom = ___(___)) %>%
# Summarize to calculate difference
___(stat = ___(___)) %>%
pull()
# See the result
diff_orig