Validação cruzada de modelos de crédito
Os empréstimos de crédito e seus dados mudam com o tempo, e nem sempre se parecerão com o que foi carregado nos conjuntos de teste atuais. Portanto, você pode usar a validação cruzada para experimentar vários conjuntos de treinamento e teste menores, derivados dos originais X_train e y_train.
Use a função XGBoost cv() para realizar a validação cruzada. Você precisará configurar todos os parâmetros para que o cv() use nos dados de teste.
Os conjuntos de dados X_train, y_train são carregados no espaço de trabalho junto com o modelo treinado gbt e o dicionário de parâmetros params que será impresso assim que o exercício for carregado.
Este exercício faz parte do curso
Modelagem de risco de crédito em Python
Instruções do exercício
- Defina o número de dobras como
5e a parada como10. Armazene-os comon_foldseearly_stopping. - Crie o objeto de matriz
DTrainusando os dados de treinamento. - Use
cv()nos parâmetros, dobras e objetos de parada antecipada. Armazene os resultados comocv_df. - Imprimir o conteúdo de
cv_df.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)