Résumer la discrimination selon le genre
Comme première étape de toute analyse, vous devez examiner et résumer les données. Les variables catégorielles sont souvent résumées à l’aide de proportions, et il est toujours important de bien comprendre le dénominateur de la proportion.
Souhaitez-vous la proportion de femmes qui ont été promues ou la proportion de personnes promues qui étaient des femmes ? Ici, vous voulez la première, donc dans votre code R il est nécessaire d’appliquer group_by() à la variable sex.
Les données de l’étude sur la discrimination sont disponibles dans votre espace de travail sous le nom disc.
Cet exercice fait partie du cours
Bases de l’inférence en R
Instructions
- À l’aide de la fonction
count()dedplyr, établissez un tableau des variablessexetpromote. - Résumez les données en utilisant
group_by()sur la variablesex. - Trouvez la proportion de personnes qui ont été promues. Nommez cette variable
promoted_prop. Notez qu’avec des variables binaires, la proportion de l’une ou l’autre valeur peut être obtenue avec la fonctionmean()(par exemplemean(variable == "value")).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a contingency table summarizing the data
disc %>%
# Count the rows by sex, promote
___
# Find proportion of each sex who were promoted
disc %>%
# Group by sex
___
# Calculate proportion promoted summary stat
___