Ajouter davantage de données
Comme les heures supplémentaires n'ont pas significativement changé d'une année à l'autre, voyez quelles autres variables vous pouvez examiner. Après discussion avec votre équipe, quelqu’un suggère d’explorer les scores d’engagement, et en particulier le nombre de personnes désengagées sur le site. Vous n’avez pas encore les données d’enquête prêtes, vous devez donc les charger et les joindre aux données avec lesquelles vous travaillez. Effectuer plusieurs jointures est courant en analytique RH.
Après la jointure, transformez year en factor(year). Comme vous ne vous intéressez à l’année que comme variable de regroupement, et non à sa valeur numérique, la convertir en facteur facilitera la suite de l’analyse.
Cet exercice fait partie du cours
Analytique RH : explorer les données des employés avec R
Instructions
- Importez
"survey_data_2.csv"en tant quesurvey_dataavecread_csv(). - Utilisez
left_join()pour ajouter les données d’engagement àhr_joined. Faites la jointure sur l’année puis l’identifiant de l’employé. - Enchaînez avec
%>%après la jointure et utilisezmutate()pour ajouterdisengaged, qui vaut 1 lorsqueengagementest inférieur ou égal à 2, et 0 sinon ; puis remplacezyearparfactor(year). Assignez le résultat de ces étapes àsafety.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the survey data
survey_data <- ___
# Create the safety dataset
safety <- ___