Randomiser la discrimination liée au genre

Rappelez-vous que nous considérons une situation où le nombre d’hommes et de femmes est fixé (les CV) et où le nombre de personnes promues est également fixé (les managers ne pouvaient promouvoir que 35 personnes).

Dans cet exercice, vous allez créer une distribution de randomisation de la statistique nulle avec 1000 réplicats, au lieu de seulement 5 dans l’exercice précédent. Pour rappel, la statistique d’intérêt est la différence de proportions promues entre les genres (c’est‑à‑dire proportion pour les hommes moins proportion pour les femmes). À partir du jeu de données initial, vous pouvez calculer en quoi les taux de promotion diffèrent entre hommes et femmes. En utilisant le flux de travail specify-hypothesis-generate-calculate dans infer, vous pouvez calculer la même statistique, mais au lieu d’obtenir un seul nombre, vous obtenez toute une distribution. Dans cet exercice, vous comparerez ce nombre issu du jeu de données original à la distribution produite par la simulation.

Cet exercice fait partie du cours

<cours>Bases de l’inférence en R</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Calculate the observed difference in promotion rate
diff_orig <- disc %>%
  # Group by sex
  group_by(___) %>%
  # Summarize to calculate fraction promoted
  ___(prop_prom = ___(___)) %>%
  # Summarize to calculate difference
  ___(stat = ___(___)) %>% 
  pull()
    
# See the result
diff_orig

Modifier et exécuter le code