Modelos crediticios de validación cruzada
Los créditos y sus datos cambian con el tiempo, y no siempre se parecerán a lo que se ha cargado en los conjuntos de pruebas actuales. Así que puedes utilizar la validación cruzada para probar varios conjuntos de entrenamiento y prueba más pequeños que se deriven de los originales X_train
y y_train
.
Utiliza la función XGBoost cv()
para realizar la validación cruzada. Tendrás que configurar todos los parámetros para que cv()
los utilice en los datos de prueba.
Los conjuntos de datos X_train
, y_train
se cargan en el espacio de trabajo junto con el modelo entrenado gbt
, y el diccionario de parámetros params
que se imprimirá una vez cargado el ejercicio.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones de ejercicio
- Ajusta el número de pliegues a
5
y la parada a10
. Guárdalos comon_folds
yearly_stopping
. - Crea el objeto matriz
DTrain
utilizando los datos de entrenamiento. - Utiliza
cv()
en los parámetros, pliegues y objetos de parada anticipada. Guarda los resultados comocv_df
. - Imprime el contenido de
cv_df
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)