Importer et joindre les données d’accidents
C’est le dernier chapitre ! Félicitations d’être arrivé·e jusque-là. Dans ce scénario, une cadre dirigeante pense que les accidents du travail ont augmenté cette année sur les sites de production. Elle souhaite que vous vérifiiez si c’est le cas et, si oui, que vous analysiez ce qui pourrait expliquer cette hausse.
Commencez par importer les jeux de données RH et accidents. Puis joignez-les et ajoutez une variable had_accident pour faciliter l’analyse des taux d’accidents.
Cet exercice fait partie du cours
Analytique RH : explorer les données des employés avec R
Instructions
- Importez
"hr_data_2.csv"et"accident_data.csv"avecread_csv(). Attribuez-les respectivement àhr_dataetaccident_data. - Utilisez
left_join()pour ajouter les données d’accidents aux données RH. Faites la jointure sur l’identifiant de l’employé et l’année. - Enchaînez avec
%>%après la jointure, puis utilisezmutate()pour ajouterhad_accident, qui vaut 0 quandaccident_typeestNA, et 1 sinon.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the packages
library(readr)
library(dplyr)
# Import the data
hr_data <- ___
accident_data <- ___
# Create hr_joined with left_join() and mutate()
hr_joined <- ___ %>%
mutate(___)
hr_joined