CommencerCommencer gratuitement

Filtrer le jeu de données

Les employés aux niveaux supérieurs comme Vice President, Director, Senior Manager, etc., évoluent dans des conditions de marché du travail très différentes et sont aussi peu nombreux ; les inclure dans votre analyse risque donc d’influencer de manière disproportionnée vos résultats.

Dans cet exercice, vous allez compter le nombre d’employés uniquement aux niveaux Analyst et Specialist en utilisant la fonction filter().

L’exemple suivant filtre df de sorte que seules les observations pour lesquelles x vaut a ou b ou c soient sélectionnées :

df %>% 
       filter(x %in% c("a", "b", "c"))

Cet exercice fait partie du cours

Analytique RH : prédire l’attrition des employés en R

Afficher le cours

Instructions

  • Commencez par compter le nombre d’employés selon les niveaux.
  • Sous-échantillonnez les données pour ne conserver que les employés aux niveaux Analyst et Specialist.
  • Vérifiez à nouveau le nombre d’employés pour tous les niveaux.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Count the number of employees across levels
org %>% 
  ___(level)

# Select the employees at Analyst and Specialist level
org2 <- org %>%
  ___(level ___) 

# Validate the results
org2 %>% 
  count(level)
Modifier et exécuter le code