CommencerCommencez gratuitement

Résumer la discrimination selon le genre

Comme première étape de toute analyse, vous devez examiner et résumer les données. Les variables catégorielles sont souvent résumées à l’aide de proportions, et il est toujours important de bien comprendre le dénominateur de la proportion.

Souhaitez-vous la proportion de femmes qui ont été promues ou la proportion de personnes promues qui étaient des femmes ? Ici, vous voulez la première, donc dans votre code R il est nécessaire d’appliquer group_by() à la variable sex.

Les données de l’étude sur la discrimination sont disponibles dans votre espace de travail sous le nom disc.

Cet exercice fait partie du cours

<cours>Bases de l’inférence en R</cours>
Voir le cours

Instructions de l’exercice

  • À l’aide de la fonction count() de dplyr, établissez un tableau des variables sex et promote.
  • Résumez les données en utilisant group_by() sur la variable sex.
  • Trouvez la proportion de personnes qui ont été promues. Nommez cette variable promoted_prop. Notez qu’avec des variables binaires, la proportion de l’une ou l’autre valeur peut être obtenue avec la fonction mean() (par exemple mean(variable == "value")).

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create a contingency table summarizing the data
disc %>%
  # Count the rows by sex, promote
  ___

# Find proportion of each sex who were promoted
disc %>%
  # Group by sex
  ___
  # Calculate proportion promoted summary stat
  ___
Modifier et exécuter le code