CommencerCommencer gratuitement

Résumer la discrimination selon le genre

Comme première étape de toute analyse, vous devez examiner et résumer les données. Les variables catégorielles sont souvent résumées à l’aide de proportions, et il est toujours important de bien comprendre le dénominateur de la proportion.

Souhaitez-vous la proportion de femmes qui ont été promues ou la proportion de personnes promues qui étaient des femmes ? Ici, vous voulez la première, donc dans votre code R il est nécessaire d’appliquer group_by() à la variable sex.

Les données de l’étude sur la discrimination sont disponibles dans votre espace de travail sous le nom disc.

Cet exercice fait partie du cours

Bases de l’inférence en R

Afficher le cours

Instructions

  • À l’aide de la fonction count() de dplyr, établissez un tableau des variables sex et promote.
  • Résumez les données en utilisant group_by() sur la variable sex.
  • Trouvez la proportion de personnes qui ont été promues. Nommez cette variable promoted_prop. Notez qu’avec des variables binaires, la proportion de l’une ou l’autre valeur peut être obtenue avec la fonction mean() (par exemple mean(variable == "value")).

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a contingency table summarizing the data
disc %>%
  # Count the rows by sex, promote
  ___

# Find proportion of each sex who were promoted
disc %>%
  # Group by sex
  ___
  # Calculate proportion promoted summary stat
  ___
Modifier et exécuter le code