AUC meten
Nu je met cross-validatie de gemiddelde out-of-sample-accuratesse hebt berekend (na omzetting vanuit een fout), is het heel eenvoudig om elke andere metriek te berekenen waarin je geïnteresseerd bent. Je hoeft deze (of een lijst met metrieken) alleen maar door te geven als argument aan de parameter metrics van xgb.cv().
Jouw taak in deze oefening is om een andere veelgebruikte metriek bij binaire classificatie te berekenen: de area under the curve ("auc"). Net als eerder zijn churn_data beschikbaar in je werkruimte, samen met de DMatrix churn_dmatrix en de parameterdictionary params.
Deze oefening maakt deel uit van de cursus
Extreme Gradient Boosting met XGBoost
Oefeninstructies
- Voer 3-fold cross-validatie uit met
5boostingrondes en"auc"als je metriek. - Print de kolom
"test-auc-mean"vancv_results.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform cross_validation: cv_results
cv_results = ____(dtrain=____, params=____,
nfold=____, num_boost_round=____,
metrics="____", as_pandas=True, seed=123)
# Print cv_results
print(cv_results)
# Print the AUC
print((cv_results["____"]).iloc[-1])