Validação cruzada de modelos de crédito
Empréstimos e seus dados mudam ao longo do tempo, e nem sempre vão se parecer com o que foi carregado nos conjuntos de teste atuais. Por isso, você pode usar validação cruzada para tentar vários conjuntos menores de treino e teste derivados de X_train e y_train originais.
Use a função cv() do XGBoost para executar a validação cruzada. Você precisará configurar todos os parâmetros para a cv() usar nos dados de teste.
Os conjuntos X_train, y_train estão carregados no workspace, junto com o modelo treinado gbt e o dicionário de parâmetros params, que será impresso quando o exercício carregar.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em Python
Instruções do exercício
- Defina o número de folds como
5e o critério de parada como10. Armazene-os emn_foldseearly_stopping. - Crie o objeto de matriz
DTrainusando os dados de treino. - Use
cv()com os parâmetros, folds e objetos de early stopping. Armazene o resultado emcv_df. - Imprima o conteúdo de
cv_df.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)