Validação cruzada de modelos de crédito
Os empréstimos de crédito e seus dados mudam com o tempo, e nem sempre se parecerão com o que foi carregado nos conjuntos de teste atuais. Portanto, você pode usar a validação cruzada para experimentar vários conjuntos de treinamento e teste menores, derivados dos originais X_train
e y_train
.
Use a função XGBoost cv()
para realizar a validação cruzada. Você precisará configurar todos os parâmetros para que o cv()
use nos dados de teste.
Os conjuntos de dados X_train
, y_train
são carregados no espaço de trabalho junto com o modelo treinado gbt
e o dicionário de parâmetros params
que será impresso assim que o exercício for carregado.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções de exercício
- Defina o número de dobras como
5
e a parada como10
. Armazene-os comon_folds
eearly_stopping
. - Crie o objeto de matriz
DTrain
usando os dados de treinamento. - Use
cv()
nos parâmetros, dobras e objetos de parada antecipada. Armazene os resultados comocv_df
. - Imprimir o conteúdo de
cv_df
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)