CommencerCommencer gratuitement

Vue d’ensemble des données maîtres

Jusqu’ici, vous avez combiné les informations des jeux de données rating et survey avec votre jeu de données initial.

Nous avons ajouté plusieurs autres informations liées aux employés, comme compensation, no_leaves_taken (nombre de jours de congé pris), hiring_source, etc., dans le jeu de données org_final. Explorez ce jeu de données avant de passer à l’ingénierie des variables dans le chapitre suivant.

Cet exercice fait partie du cours

Analytique RH : prédire l’attrition des employés en R

Afficher le cours

Instructions

  • Utilisez glimpse() pour afficher la structure du jeu de données org_final.
  • Assignez le nombre de variables du jeu de données org_final à variables.
  • Générez un box-plot pour visualiser la distribution de distance_from_home chez les employés Active et Inactive.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# View the structure of the dataset
___

# Number of variables in the dataset
variables <- ___

# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
  ___
Modifier et exécuter le code