Ajuster l’arbre aux données des employés

Une séparation train/test permet de développer le classificateur sur l’échantillon d’entraînement et de le tester sur le reste du jeu de données. Dans cet exercice, vous allez commencer à développer un modèle de prédiction du turnover des employés à l’aide de l’algorithme de classification decision tree. L’algorithme fournit une méthode .fit() qui permet d’ajuster les variables explicatives au modèle sur l’ensemble d’entraînement.

Rappel : la cible et les variables explicatives sont déjà divisées en parties entraînement et test (Train : features_train, target_train, Test : features_test, target_test).

Cet exercice fait partie du cours

<cours>Analytique RH : prédire l’attrition des employés en Python</cours>

Voir le cours

Instructions de l’exercice

Importez l’algorithme de classification appelé DecisionTreeClassifier.
Initialisez-le sous le nom model et fixez l’état aléatoire à 42.
Appliquez le modèle d’arbre de décision en ajustant les variables explicatives de l’ensemble d’entraînement au model.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Import the classification algorithm
from sklearn.tree import ____

# Initialize it and call model by specifying the random_state parameter
model = ____(random_state=42)

# Apply a decision tree model to fit features to the target
model.____(features_train, ____)

Modifier et exécuter le code