Mesurer l’AUC
Après avoir utilisé la validation croisée pour calculer la précision moyenne hors échantillon (à partir de l’erreur), vous pouvez très facilement calculer toute autre métrique qui vous intéresse. Il suffit de la passer (ou de passer une liste de métriques) en argument au paramètre metrics de xgb.cv().
Votre objectif dans cet exercice est de calculer une autre métrique courante en classification binaire : l’aire sous la courbe ("auc"). Comme précédemment, churn_data est disponible dans votre espace de travail, ainsi que la DMatrix churn_dmatrix et le dictionnaire de paramètres params.
Cet exercice fait partie du cours
Extreme Gradient Boosting avec XGBoost
Instructions
- Effectuez une validation croisée en 3 plis avec
5itérations de boosting et"auc"comme métrique. - Affichez la colonne
"test-auc-mean"decv_results.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Perform cross_validation: cv_results
cv_results = ____(dtrain=____, params=____,
nfold=____, num_boost_round=____,
metrics="____", as_pandas=True, seed=123)
# Print cv_results
print(cv_results)
# Print the AUC
print((cv_results["____"]).iloc[-1])