Aan de slagGa gratis aan de slag

Target en features scheiden

Om een voorspelling te doen (in dit geval of een medewerker weggaat of niet), moet je de gegevensset in twee onderdelen splitsen:

  • de afhankelijke variabele of target die je wilt voorspellen
  • de onafhankelijke variabelen of features die je gebruikt om te voorspellen

Jouw taak is om de target en de features te scheiden. De target hier is de medewerkerchurn, en de features bevatten al het andere.

Ter herinnering: de gegevensset is al aangepast door categorische variabelen te encoden en dummies te maken.

pandas is al voor je geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

HR-analytics: verloop van medewerkers voorspellen in Python

Cursus bekijken

Oefeninstructies

  • Stel de target en features in:
    • Kies de kolom van de afhankelijke variabele (churn) en zet die als target.
    • Gebruik .drop() op de kolom churn om de rest als features te zetten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Set the target and features

# Choose the dependent variable column (churn) and set it as target
target = data.____

# Drop column churn and set everything else as features
features = data.____("____",axis=1)
Code bewerken en uitvoeren