Corroborer les découpages
Dans l’exercice précédent, vous avez scindé l’ensemble de données en train_set et test_set. Il est important de vérifier que les données sur lesquelles vous entraînez votre modèle sont représentatives du jeu de test. Assurons‑nous donc que train_set et test_set ont la même proportion d’employés actifs et inactifs.
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en R
Instructions
Calculez la proportion d’employés Active et Inactive dans train_set et test_set.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate turnover proportion in train_set
train_set %>%
___(status) %>%
___(prop = n / sum(n))
# Calculate turnover proportion in test_set
test_set %>%
___(status) %>%
___(prop = n / sum(n))