Créer une matrice de confusion
Comme vous l’avez vu dans la vidéo, une matrice de confusion permet d’évaluer la performance de votre modèle. Toutefois, avant de la créer, vous devez classer les probabilités prédites en 1 ou 0 à l’aide d’un seuil.
Remarque : 1 signifie Inactif tandis que 0 signifie Actif.
prediction_test, qui contient les probabilités prédites de départ pour tous les cas de test_set, est disponible dans votre espace de travail.
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en R
Instructions
- Transformez les prédictions numériques de
prediction_testen un vecteur de prédictions catégorielles en utilisant un seuil de 0,5. - Créez la matrice de confusion en utilisant
prediction_categorieset les valeurs réelles de l’ensemble de test (test_set$turnover).
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Classify predictions using a cut-off of 0.5
prediction_categories <- ___(prediction_test > 0.5, 1, 0)
# Construct a confusion matrix
conf_matrix <- ___(prediction_categories, test_set$turnover)
conf_matrix