Ajuster l’arbre aux données des employés
Une séparation train/test permet de développer le classificateur sur l’échantillon d’entraînement et de le tester sur le reste du jeu de données. Dans cet exercice, vous allez commencer à développer un modèle de prédiction du turnover des employés à l’aide de l’algorithme de classification decision tree. L’algorithme fournit une méthode .fit() qui permet d’ajuster les variables explicatives au modèle sur l’ensemble d’entraînement.
Rappel : la cible et les variables explicatives sont déjà divisées en parties entraînement et test (Train : features_train, target_train, Test : features_test, target_test).
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en Python
Instructions
- Importez l’algorithme de classification appelé
DecisionTreeClassifier. - Initialisez-le sous le nom
modelet fixez l’état aléatoire à 42. - Appliquez le modèle d’arbre de décision en ajustant les variables explicatives de l’ensemble d’entraînement au
model.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the classification algorithm
from sklearn.tree import ____
# Initialize it and call model by specifying the random_state parameter
model = ____(random_state=42)
# Apply a decision tree model to fit features to the target
model.____(features_train, ____)