Évaluer les performances avec yardstick
Dans l’exercice précédent, vous avez calculé des métriques de classification à partir d’une matrice de confusion d’exemple. Le package yardstick a été conçu pour automatiser ce processus.
Pour les modèles de classification, les fonctions de yardstick prennent en premier argument un tibble contenant les résultats du modèle. Celui-ci doit inclure les valeurs réelles de la variable cible, les valeurs prédites et les probabilités estimées pour chaque modalité de la variable cible.
Dans cet exercice, vous utiliserez les résultats de votre modèle de régression logistique, telecom_results, pour calculer des métrriques de performance.
Le tibble telecom_results a été chargé dans votre session.
Cet exercice fait partie du cours
Modéliser avec tidymodels en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the confusion matrix
___(___, truth = ___,
estimate = ___)