De boom afstemmen op werknemersdata
Een train/test-split geeft je de mogelijkheid om de classifier te ontwikkelen op het trainingsgedeelte en te testen op de rest van de gegevensset. In deze oefening begin je met het bouwen van een model om personeelsverloop te voorspellen met het classificatie-algoritme decision tree. Het algoritme biedt een .fit()-methode, waarmee je de features in de trainingsset op het model kunt afstemmen.
Ter herinnering: zowel target als features zijn al opgesplitst in train- en testonderdelen (Train: features_train, target_train, Test: features_test, target_test)
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Oefeninstructies
- Importeer het classificatie-algoritme
DecisionTreeClassifier. - Initialiseer het als
modelen zet de random state op 42. - Pas het decision tree-model toe door de trainingsfeatures te fitten op het
model.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the classification algorithm
from sklearn.tree import ____
# Initialize it and call model by specifying the random_state parameter
model = ____(random_state=42)
# Apply a decision tree model to fit features to the target
model.____(features_train, ____)