Aan de slagGa gratis aan de slag

Overzicht masterdata

Tot nu toe heb je informatie uit de gegevenssets rating en survey gecombineerd met je oorspronkelijke gegevensset.

We hebben verschillende andere medewerkergerelateerde gegevens toegevoegd, zoals compensation, no_leaves_taken (aantal opgenomen vakantiedagen), hiring_source enz., in de gegevensset org_final. Bekijk deze gegevensset alvast voordat je in het volgende hoofdstuk met feature engineering aan de slag gaat.

Deze oefening maakt deel uit van de cursus

HR-analytics: verloop van medewerkers voorspellen in R

Cursus bekijken

Oefeninstructies

  • Gebruik glimpse() om de structuur van de gegevensset org_final te bekijken.
  • Ken het aantal variabelen in de gegevensset org_final toe aan variables.
  • Maak een boxplot om de verdeling van distance_from_home voor Active en Inactive medewerkers te visualiseren.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# View the structure of the dataset
___

# Number of variables in the dataset
variables <- ___

# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
  ___
Code bewerken en uitvoeren