Ongevallengegevens importeren en samenvoegen
Dit is de laatste hoofdstukopdracht! Gefeliciteerd dat je zover bent gekomen. In dit scenario denkt een senior executive dat het aantal bedrijfsongevallen het afgelopen jaar is toegenomen op de productielocaties. Ze wil dat jij uitzoekt of dat klopt en, als dat zo is, onderzoekt wat die toename kan veroorzaken.
Begin met het importeren van de HR- en ongevallengegevenssets. Voeg ze daarna samen en voeg een variabele had_accident toe om het analyseren van ongevallenpercentages makkelijker te maken.
Deze oefening maakt deel uit van de cursus
HR-analytics: werknemersgegevens verkennen in R
Oefeninstructies
- Importeer
"hr_data_2.csv"en"accident_data.csv"metread_csv(). Ken ze respectievelijk toe aanhr_dataenaccident_data. - Gebruik
left_join()om de ongevallengegevens aan de HR-gegevens toe te voegen. Join op zowel medewerkers-ID als jaar. - Gebruik na de join
%>%enmutate()omhad_accidenttoe te voegen, die 0 is wanneeraccident_typeNAis en anders 1.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the packages
library(readr)
library(dplyr)
# Import the data
hr_data <- ___
accident_data <- ___
# Create hr_joined with left_join() and mutate()
hr_joined <- ___ %>%
mutate(___)
hr_joined