Aan de slagGa gratis aan de slag

De gegevensset filteren

Medewerkers op hogere niveaus zoals Vice President, Director, Senior Manager enzovoort hebben heel andere arbeidsmarktcondities en komen ook minder vaak voor. Als je ze meeneemt in je analyse kan dat je resultaten onevenredig beïnvloeden.

In deze oefening tel je daarom alleen het aantal medewerkers op de niveaus Analyst en Specialist met de functie filter().

Het volgende voorbeeld filtert df zodat alleen de observaties worden geselecteerd waarvoor x a of b of c is:

df %>% 
       filter(x %in% c("a", "b", "c"))

Deze oefening maakt deel uit van de cursus

HR-analytics: verloop van medewerkers voorspellen in R

Cursus bekijken

Oefeninstructies

  • Tel eerst het aantal medewerkers per niveau.
  • Maak een subset van de data zodat je alleen medewerkers op de niveaus Analyst en Specialist overhoudt.
  • Bekijk daarna opnieuw het aantal medewerkers per niveau.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Count the number of employees across levels
org %>% 
  ___(level)

# Select the employees at Analyst and Specialist level
org2 <- org %>%
  ___(level ___) 

# Validate the results
org2 %>% 
  count(level)
Code bewerken en uitvoeren