Vue d’ensemble des données maîtres
Jusqu’ici, vous avez combiné les informations des jeux de données rating et survey avec votre jeu de données initial.
Nous avons ajouté plusieurs autres informations liées aux employés, comme compensation, no_leaves_taken (nombre de jours de congé pris), hiring_source, etc., dans le jeu de données org_final. Explorez ce jeu de données avant de passer à l’ingénierie des variables dans le chapitre suivant.
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en R
Instructions
- Utilisez
glimpse()pour afficher la structure du jeu de donnéesorg_final. - Assignez le nombre de variables du jeu de données
org_finalàvariables. - Générez un box-plot pour visualiser la distribution de
distance_from_homechez les employésActiveetInactive.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# View the structure of the dataset
___
# Number of variables in the dataset
variables <- ___
# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
___