Límites de las pruebas de validación cruzada

Puedes especificar números muy grandes tanto para nfold como para num_boost_round si quieres realizar una cantidad extrema de validación cruzada. El marco de datos cv_results_big ya se ha cargado en el espacio de trabajo y se ha creado con el siguiente código:

cv = xgb.cv(params, DTrain, num_boost_round = 600, nfold=10,

            shuffle = True)

Aquí, cv() realizó ¡600 iteraciones de validación cruzada! El parámetro shuffle indica a la función que baraje los registros cada vez.

Echa un vistazo a estos datos para ver cuáles son los AUC, y comprueba si llegan a 1.0 utilizando la validación cruzada. También debes trazar la puntuación del test AUC para ver la progresión.

El marco de datos cv_results_big se ha cargado en el espacio de trabajo.

Imprime las cinco primeras filas del marco de datos de resultados CV.
Imprime la media del conjunto de pruebas AUC del marco de datos de resultados CV redondeada a dos cifras.
Traza un gráfico lineal del conjunto de pruebas AUC a lo largo de cada iteración.

Exploración y preparación de datos para préstamos

Regresión logística para incumplimientos

Árboles potenciados por gradiente con XGBoost

Evaluación e implementación del modelo

Exercice

Límites de las pruebas de validación cruzada

Instructions