CommencerCommencez gratuitement

Vue d’ensemble des données maîtres

Jusqu’ici, vous avez combiné les informations des jeux de données rating et survey avec votre jeu de données initial.

Nous avons ajouté plusieurs autres informations liées aux employés, comme compensation, no_leaves_taken (nombre de jours de congé pris), hiring_source, etc., dans le jeu de données org_final. Explorez ce jeu de données avant de passer à l’ingénierie des variables dans le chapitre suivant.

Cet exercice fait partie du cours

<cours>Analytique RH : prédire l’attrition des employés en R</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez glimpse() pour afficher la structure du jeu de données org_final.
  • Assignez le nombre de variables du jeu de données org_final à variables.
  • Générez un box-plot pour visualiser la distribution de distance_from_home chez les employés Active et Inactive.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# View the structure of the dataset
___

# Number of variables in the dataset
variables <- ___

# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
  ___
Modifier et exécuter le code