Misurare l'AUC
Ora che hai usato la cross-validation per calcolare l'accuratezza media out-of-sample (dopo la conversione dall'errore), è molto semplice calcolare qualsiasi altra metrica che ti interessi. Ti basta passarla (o passare un elenco di metriche) come argomento al parametro metrics di xgb.cv().
Il tuo compito in questo esercizio è calcolare un'altra metrica comune usata nella classificazione binaria: l'area sotto la curva ("auc"). Come prima, churn_data è disponibile nel tuo workspace, insieme alla DMatrix churn_dmatrix e al dizionario dei parametri params.
Questo esercizio fa parte del corso
Extreme Gradient Boosting con XGBoost
Istruzioni dell'esercizio
- Esegui una cross-validation a 3 fold con
5round di boosting e"auc"come metrica. - Stampa la colonna
"test-auc-mean"dicv_results.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform cross_validation: cv_results
cv_results = ____(dtrain=____, params=____,
nfold=____, num_boost_round=____,
metrics="____", as_pandas=True, seed=123)
# Print cv_results
print(cv_results)
# Print the AUC
print((cv_results["____"]).iloc[-1])