Randomiser la discrimination liée au genre
Rappelez-vous que nous considérons une situation où le nombre d’hommes et de femmes est fixé (les CV) et où le nombre de personnes promues est également fixé (les managers ne pouvaient promouvoir que 35 personnes).
Dans cet exercice, vous allez créer une distribution de randomisation de la statistique nulle avec 1000 réplicats, au lieu de seulement 5 dans l’exercice précédent. Pour rappel, la statistique d’intérêt est la différence de proportions promues entre les genres (c’est‑à‑dire proportion pour les hommes moins proportion pour les femmes). À partir du jeu de données initial, vous pouvez calculer en quoi les taux de promotion diffèrent entre hommes et femmes. En utilisant le flux de travail specify-hypothesis-generate-calculate dans infer, vous pouvez calculer la même statistique, mais au lieu d’obtenir un seul nombre, vous obtenez toute une distribution. Dans cet exercice, vous comparerez ce nombre issu du jeu de données original à la distribution produite par la simulation.
Cet exercice fait partie du cours
Bases de l’inférence en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
# Group by sex
group_by(___) %>%
# Summarize to calculate fraction promoted
___(prop_prom = ___(___)) %>%
# Summarize to calculate difference
___(stat = ___(___)) %>%
pull()
# See the result
diff_orig