Modelos crediticios de validación cruzada
Los créditos y sus datos cambian con el tiempo, y no siempre se parecerán a lo que se ha cargado en los conjuntos de pruebas actuales. Así que puedes utilizar la validación cruzada para probar varios conjuntos de entrenamiento y prueba más pequeños que se deriven de los originales X_train y y_train.
Utiliza la función XGBoost cv() para realizar la validación cruzada. Tendrás que configurar todos los parámetros para que cv() los utilice en los datos de prueba.
Los conjuntos de datos X_train, y_train se cargan en el espacio de trabajo junto con el modelo entrenado gbt, y el diccionario de parámetros params que se imprimirá una vez cargado el ejercicio.
Este ejercicio forma parte del curso
Modelado del riesgo crediticio en Python
Instrucciones del ejercicio
- Ajusta el número de pliegues a
5y la parada a10. Guárdalos comon_foldsyearly_stopping. - Crea el objeto matriz
DTrainutilizando los datos de entrenamiento. - Utiliza
cv()en los parámetros, pliegues y objetos de parada anticipada. Guarda los resultados comocv_df. - Imprime el contenido de
cv_df.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)