Target en features scheiden
Om een voorspelling te doen (in dit geval of een medewerker weggaat of niet), moet je de gegevensset in twee onderdelen splitsen:
- de afhankelijke variabele of target die je wilt voorspellen
- de onafhankelijke variabelen of features die je gebruikt om te voorspellen
Jouw taak is om de target en de features te scheiden. De target hier is de medewerkerchurn, en de features bevatten al het andere.
Ter herinnering: de gegevensset is al aangepast door categorische variabelen te encoden en dummies te maken.
pandas is al voor je geïmporteerd als pd.
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Oefeninstructies
- Stel de target en features in:
- Kies de kolom van de afhankelijke variabele (
churn) en zet die alstarget. - Gebruik
.drop()op de kolomchurnom de rest alsfeatureste zetten.
- Kies de kolom van de afhankelijke variabele (
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Set the target and features
# Choose the dependent variable column (churn) and set it as target
target = data.____
# Drop column churn and set everything else as features
features = data.____("____",axis=1)