Medindo a AUC
Agora que você usou validação cruzada para calcular a acurácia média fora da amostra (após converter a partir de um erro), fica muito fácil calcular qualquer outra métrica de interesse. Tudo o que você precisa fazer é passá-la (ou uma lista de métricas) como argumento para o parâmetro metrics de xgb.cv().
Sua tarefa neste exercício é calcular outra métrica comum em classificação binária — a área sob a curva ("auc"). Como antes, churn_data está disponível no seu ambiente, junto com a DMatrix churn_dmatrix e o dicionário de parâmetros params.
Este exercício faz parte do curso
Extreme Gradient Boosting com XGBoost
Instruções do exercício
- Realize validação cruzada com 3 dobras,
5rounds de boosting e"auc"como sua métrica. - Imprima a coluna
"test-auc-mean"decv_results.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform cross_validation: cv_results
cv_results = ____(dtrain=____, params=____,
nfold=____, num_boost_round=____,
metrics="____", as_pandas=True, seed=123)
# Print cv_results
print(cv_results)
# Print the AUC
print((cv_results["____"]).iloc[-1])