Aan de slagGa gratis aan de slag

AUC meten

Nu je met cross-validatie de gemiddelde out-of-sample-accuratesse hebt berekend (na omzetting vanuit een fout), is het heel eenvoudig om elke andere metriek te berekenen waarin je geïnteresseerd bent. Je hoeft deze (of een lijst met metrieken) alleen maar door te geven als argument aan de parameter metrics van xgb.cv().

Jouw taak in deze oefening is om een andere veelgebruikte metriek bij binaire classificatie te berekenen: de area under the curve ("auc"). Net als eerder zijn churn_data beschikbaar in je werkruimte, samen met de DMatrix churn_dmatrix en de parameterdictionary params.

Deze oefening maakt deel uit van de cursus

Extreme Gradient Boosting met XGBoost

Cursus bekijken

Oefeninstructies

  • Voer 3-fold cross-validatie uit met 5 boostingrondes en "auc" als je metriek.
  • Print de kolom "test-auc-mean" van cv_results.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Perform cross_validation: cv_results
cv_results = ____(dtrain=____, params=____, 
                  nfold=____, num_boost_round=____, 
                  metrics="____", as_pandas=True, seed=123)

# Print cv_results
print(cv_results)

# Print the AUC
print((cv_results["____"]).iloc[-1])
Code bewerken en uitvoeren