Séparer la cible et les features
Pour effectuer une prédiction (dans ce cas, savoir si un employé va partir ou non), il faut séparer le jeu de données en deux éléments :
- la variable dépendante ou target à prédire
- les variables indépendantes ou features qui serviront à faire la prédiction
Votre tâche consiste à séparer la target et les features. Ici, la target correspond au churn des employés, et les features regroupent toutes les autres colonnes.
Rappel : le jeu de données a déjà été modifié en encodant les variables catégorielles et en créant des dummies.
pandas a été importé pour vous sous l’alias pd.
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en Python
Instructions
- Définissez la target et les features :
- Choisissez la colonne de la variable dépendante (
churn) et affectez-la àtarget. - Utilisez
.drop()sur la colonnechurnpour définir tout le reste commefeatures.
- Choisissez la colonne de la variable dépendante (
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set the target and features
# Choose the dependent variable column (churn) and set it as target
target = data.____
# Drop column churn and set everything else as features
features = data.____("____",axis=1)