Corroborer les découpages
Dans l’exercice précédent, vous avez scindé l’ensemble de données en train_set et test_set. Il est important de vérifier que les données sur lesquelles vous entraînez votre modèle sont représentatives du jeu de test. Assurons‑nous donc que train_set et test_set ont la même proportion d’employés actifs et inactifs.
Cet exercice fait partie du cours
<cours>Analytique RH : prédire l’attrition des employés en R</cours>Instructions de l’exercice
Calculez la proportion d’employés Active et Inactive dans train_set et test_set.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Calculate turnover proportion in train_set
train_set %>%
___(status) %>%
___(prop = n / sum(n))
# Calculate turnover proportion in test_set
test_set %>%
___(status) %>%
___(prop = n / sum(n))