ComenzarEmpieza gratis

Modelos crediticios de validación cruzada

Los créditos y sus datos cambian con el tiempo, y no siempre se parecerán a lo que se ha cargado en los conjuntos de pruebas actuales. Así que puedes utilizar la validación cruzada para probar varios conjuntos de entrenamiento y prueba más pequeños que se deriven de los originales X_train y y_train.

Utiliza la función XGBoost cv() para realizar la validación cruzada. Tendrás que configurar todos los parámetros para que cv() los utilice en los datos de prueba.

Los conjuntos de datos X_train, y_train se cargan en el espacio de trabajo junto con el modelo entrenado gbt, y el diccionario de parámetros params que se imprimirá una vez cargado el ejercicio.

Este ejercicio forma parte del curso

Modelado del riesgo crediticio en Python

Ver curso

Instrucciones de ejercicio

  • Ajusta el número de pliegues a 5 y la parada a 10. Guárdalos como n_folds y early_stopping.
  • Crea el objeto matriz DTrain utilizando los datos de entrenamiento.
  • Utiliza cv() en los parámetros, pliegues y objetos de parada anticipada. Guarda los resultados como cv_df.
  • Imprime el contenido de cv_df.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Set the values for number of folds and stopping iterations
____ = ____
____ = ____

# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)

# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
            early_stopping_rounds=____)

# Print the cross validations data frame
____(____)
Editar y ejecutar código