De gegevensset filteren
Medewerkers op hogere niveaus zoals Vice President, Director, Senior Manager enzovoort hebben heel andere arbeidsmarktcondities en komen ook minder vaak voor. Als je ze meeneemt in je analyse kan dat je resultaten onevenredig beïnvloeden.
In deze oefening tel je daarom alleen het aantal medewerkers op de niveaus Analyst en Specialist met de functie filter().
Het volgende voorbeeld filtert df zodat alleen de observaties worden geselecteerd waarvoor x a of b of c is:
df %>%
filter(x %in% c("a", "b", "c"))
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in R
Oefeninstructies
- Tel eerst het aantal medewerkers per niveau.
- Maak een subset van de data zodat je alleen medewerkers op de niveaus
AnalystenSpecialistoverhoudt. - Bekijk daarna opnieuw het aantal medewerkers per niveau.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Count the number of employees across levels
org %>%
___(level)
# Select the employees at Analyst and Specialist level
org2 <- org %>%
___(level ___)
# Validate the results
org2 %>%
count(level)